Size: a a a

RL reading group

2018 March 22

EZ

Evgenii Zheltonozhsk... in RL reading group
проблемы
источник

P

Pavel Shvechikov in RL reading group
Я бегу
источник

SK

Sergey Kolesnikov in RL reading group
а может кто пустить?
источник

SK

Sergey Kolesnikov in RL reading group
внезапно пропуск перестал работать
источник

AP

Anton Pechenko in RL reading group
на какой проходной?
источник

AP

Anton Pechenko in RL reading group
у меня есть бейджик, могу подойти
источник

SO

Sergey Ovcharenko in RL reading group
источник

AP

Anton Pechenko in RL reading group
источник

AP

Anton Pechenko in RL reading group
видно/слышно?
источник

АК

Андрей Квасов... in RL reading group
Да, отлично, спасибо!
источник

АС

Артём С in RL reading group
Да, всё ок
источник
2018 March 23

P

Pavel Shvechikov in RL reading group
Коллеги, большая просьба – если вы видите новые статьи (особенно про POMDP / мультиагентов), сбрасывайте в  https://t.me/rlpapers, не стесняйтесь.
источник
2018 March 26

АП

Алексей Полиевиц... in RL reading group
в этот четверг будет что-нибудь?
источник

c

cydoroga in RL reading group
Да, семинар будет
Анонс сделаю чуть позже
источник
2018 March 28

c

cydoroga in RL reading group
Попытка номер 2
В этот четверг на семинаре выступлю я.
Начало в 19:00, аудитория Стенфорд, ШАД.

Не забудьте зарегистрироваться по ссылке до сегодняшней ночи , если хотите прийти:
https://docs.google.com/forms/d/e/1FAIpQLSd18PGkZuOqkWThJhmNxnmiSVFicnH4YwLVTCOkEkVQV6ZIDg/viewform

Расскажу про Model Ensemble Trust Policy Optimization - немного не про ту статью, про которую планировал сначала.
https://arxiv.org/abs/1802.10592
Авторы показывают эффективный способ борьбы с проблемой переобучения policy на восстановленную динамику модели в областях, где эта динамика работает плохо.
Авторы провели массивное сравнение предлагаемого метода с model-based и model-free бэйзлайнами.
Также, поскольку идея статьи весьма короткая, мы сможем разобрать все детали в деталях и, как бонус, разберёмся с давно не новым методом TRPO, который изнутри знаком не всем, а для именно этой статьи его понимание - большой плюс

Приходите, будет интересно
источник

LG

Leonid Gremyachikh in RL reading group
👍
источник

P

Pavel Shvechikov in RL reading group
Не могу не поделиться
Can agents learn inside of their own dreams?
https://worldmodels.github.io/
источник

ME

Matvey Ezhov in RL reading group
^ Шмидхубер один из очень немногих кто во время последней AI winter продолжали пушить в сторону AGI. Я очень рад что теперь он научился пиариться так же как major AI labs.
источник

LY

Liubov Yaronskaya in RL reading group
Это прекрасно!
источник

IK

Ivan Kharitonov in RL reading group
с машинкой понравился пример
источник