Телеграмм чат группы theoreticalrl страница 75

Попытка номер 2
В этот четверг на семинаре выступлю я.
Начало в 19:00, аудитория Стенфорд, ШАД.

Не забудьте зарегистрироваться по ссылке до сегодняшней ночи , если хотите прийти:
https://docs.google.com/forms/d/e/1FAIpQLSd18PGkZuOqkWThJhmNxnmiSVFicnH4YwLVTCOkEkVQV6ZIDg/viewform

Расскажу про Model Ensemble Trust Policy Optimization - немного не про ту статью, про которую планировал сначала.
https://arxiv.org/abs/1802.10592
Авторы показывают эффективный способ борьбы с проблемой переобучения policy на восстановленную динамику модели в областях, где эта динамика работает плохо.
Авторы провели массивное сравнение предлагаемого метода с model-based и model-free бэйзлайнами.
Также, поскольку идея статьи весьма короткая, мы сможем разобрать все детали в деталях и, как бонус, разберёмся с давно не новым методом TRPO, который изнутри знаком не всем, а для именно этой статьи его понимание - большой плюс

Приходите, будет интересно

Google Docs

Deep RL reading group meeting

Если у Вас нет ШАДовского пропуска, и если Вы бы хотели посетить семинар, на котором разбираются статьи про RL, то эта форма – для Вас!

Несколько важных моментов:

1. Эту форму нужно будет заполнять КАЖДЫЙ РАЗ перед каждым семинаром, указывая дату предстоящего семинара

2. Отправлять форму нужно НЕ ПОЗЖЕ ВЕЧЕРА ДНЯ ПРЕДШЕСТВУЮЩЕГО СЕМИНАРУ (не позже среды, если семинар в чт). Если вдруг вы в день семинара поняли, что не успели отправить форму – пишите организаторам, что-нибудь придумаем!

3. В день семинара нужно ПРИХОДИТЬ С ПАСПОРТОМ. Без него могут не пустить.

источник

09:10пожаловаться #15

Leonid Gremyachikh in RL reading group

👍

источник

09:19пожаловаться #16

Pavel Shvechikov in RL reading group

Не могу не поделиться
Can agents learn inside of their own dreams?
https://worldmodels.github.io/

World Models

Can agents learn inside of their own dreams?

источник

13:48пожаловаться #17

Matvey Ezhov in RL reading group

^ Шмидхубер один из очень немногих кто во время последней AI winter продолжали пушить в сторону AGI. Я очень рад что теперь он научился пиариться так же как major AI labs.

источник

13:55пожаловаться #18

Liubov Yaronskaya in RL reading group

Это прекрасно!

источник

14:49пожаловаться #19

Ivan Kharitonov in RL reading group

с машинкой понравился пример

источник

15:06пожаловаться #20