Size: a a a

RL reading group

2019 August 30

СВ

Сергей Власов... in RL reading group
Всем привет, не могу понять отличие double Q-learning от deep. И там и там есть 2 сети : target и eveluate.
источник

SM

Sasha Malysheva in RL reading group
источник

CP

Cherry Pie in RL reading group
Это откуда слайд?
источник

SM

Sasha Malysheva in RL reading group
Это я сама разбиралась, формат ‘конспектов’ по статьям : )
источник

СВ

Сергей Власов... in RL reading group
А минус - это что значит?
источник

DN

Dmitry Nikulin in RL reading group
Sasha Malysheva
Это я сама разбиралась, формат ‘конспектов’ по статьям : )
А ты это выложила куда-нибудь? Стрелочки прикольные, это tikz?
источник

SM

Sasha Malysheva in RL reading group
Это гугл презентация 😅
источник

SM

Sasha Malysheva in RL reading group
источник

СВ

Сергей Власов... in RL reading group
Спасибо, хотя по схеме обучения все равно остались вопросы
источник

IB

Ilya Boldyrev in RL reading group
источник

c

cydoroga in RL reading group
Сергей Власов
Спасибо, хотя по схеме обучения все равно остались вопросы
Посмотри курс practical reinforcement learning на Coursera
Там есть отдельное видео про double q-learning
Но можно и весь курс глянуть)
источник

СВ

Сергей Власов... in RL reading group
cydoroga
Посмотри курс practical reinforcement learning на Coursera
Там есть отдельное видео про double q-learning
Но можно и весь курс глянуть)
Спасибо
источник
2019 September 02

AP

Alexander Potashev in RL reading group
Приветики
источник
2019 September 06

AC

Artur Chakhvadze in RL reading group
Kek
источник

AC

Artur Chakhvadze in RL reading group
Предлагаю заспамить чувака по ссылке в ответ
источник
2019 September 10

c

cydoroga in RL reading group
Всем привет!

На этой неделе на семинаре выступит Дмитрий Никулин (@Erring ) с докладом о своей собственной работе Free-Lunch Saliency via Attention in Atari Agents

Встречаемся в четверг (12 сентября)
ШАД, аудитория еще уточняется!
В 19:00

Аннотация:
Я расскажу про статью (https://arxiv.org/abs/1908.02511), которую мы опубликовали месяц назад. Мы успешно прикрутили attention к моделям, играющим в Atari from raw pixels и сравнили с конкурентами качество игры и качество визуализаций аттеншна. В итоге однозначно выиграли по качеству игры и получили сравнимые результаты по визуализациям. 450 обученных моделей, 3686400 завершившихся эпизодов, сотни GPU-часов, море графиков. Трейлер: https://youtu.be/i41rQXKsa50

Приходите :)
источник

c

cydoroga in RL reading group
Если у вас нет пропуска в ШАД, не забудьте зарегистрироваться по ссылке до 12ти ночи со среды на четверг:
https://docs.google.com/forms/d/e/1FAIpQLSd18PGkZuOqkWThJhmNxnmiSVFicnH4YwLVTCOkEkVQV6ZIDg/viewform
источник

DN

Dmitry Nikulin in RL reading group
cydoroga
Всем привет!

На этой неделе на семинаре выступит Дмитрий Никулин (@Erring ) с докладом о своей собственной работе Free-Lunch Saliency via Attention in Atari Agents

Встречаемся в четверг (12 сентября)
ШАД, аудитория еще уточняется!
В 19:00

Аннотация:
Я расскажу про статью (https://arxiv.org/abs/1908.02511), которую мы опубликовали месяц назад. Мы успешно прикрутили attention к моделям, играющим в Atari from raw pixels и сравнили с конкурентами качество игры и качество визуализаций аттеншна. В итоге однозначно выиграли по качеству игры и получили сравнимые результаты по визуализациям. 450 обученных моделей, 3686400 завершившихся эпизодов, сотни GPU-часов, море графиков. Трейлер: https://youtu.be/i41rQXKsa50

Приходите :)
"Своей собственной" — не совсем верное утверждение, у меня есть соавторы :) В остальном всё так 👌
источник

DC

Dany Chepenko in RL reading group
Как насчет стрима?
источник

c

cydoroga in RL reading group
Dany Chepenko
Как насчет стрима?
Стрим вряд ли.
Возможно будет запись, но это можно будет уточнить только в четверг.
источник