Size: a a a

RL reading group

2018 September 14

АС

Артём С in RL reading group
Не, не все
источник

AP

Anton Pechenko in RL reading group
что-то я не распарсил ссылку на репо с алгоритмами из этого поста, видимо этого и не предполагается, я чет увидел гитхаб в ссылке и решил что реализации тоже будут
источник

P

Pavel Shvechikov in RL reading group
Artem Ryzhikov
Вкладка papers to discuss же? Я правильно понял, что всего два человека докладывались оттуда?
Нет, оттуда удалялись статьи, которые были рассказаны.
источник

P

Pavel Shvechikov in RL reading group
Sergey Kolesnikov
очень топовый обзор на max entropy rl by Levine:
https://arxiv.org/abs/1805.00909
байесовский катарсис, да и вообще тема огонь
PS. надо бы обновить papers за полгода
You are welcomed!
Хорошо бы ещё NIPSовые статьи этого года добавить
источник

SK

Sergey Kolesnikov in RL reading group
@ipaulo а как с семинарами в этом году?
источник

P

Pavel Shvechikov in RL reading group
Sergey Kolesnikov
@ipaulo а как с семинарами в этом году?
Первый будет ~20, @cydoroga сделает скоро объявление
источник
2018 September 20

c

cydoroga in RL reading group
Всем привет!
Первый семинар группы в этом учебном году пройдет  27 сентября
Место и время те же:
ШАД, ауд Стенфорд
Четверг, 19:00

Желающие выступить с докладом на семинаре могут записаться, написав мне здесь в телеграме.
Выступление на семинаре поможет вам самим подробнее разобраться с интересным материалом. Подготовка доклада и ответов на возможные вопросы позволяют заметить нюансы, незаметные при простом чтении статей.

Интересные темы для выступления можно найти, например, в чате https://t.me/rlpapers

На семинаре 27го числа выступлю я. Анонс выступления будет чуть позже!

Если у вас нет пропуска, не забудьте зарегистрироваться по ссылке до утра четверга :
https://docs.google.com/forms/d/e/1FAIpQLSd18PGkZuOqkWThJhmNxnmiSVFicnH4YwLVTCOkEkVQV6ZIDg/viewform

Ждем вас!
источник
2018 September 23

EZ

Evgenii Zheltonozhsk... in RL reading group
набег из одс?
источник

О

Олег in RL reading group
да
источник
2018 September 26

c

cydoroga in RL reading group
cydoroga
Всем привет!
Первый семинар группы в этом учебном году пройдет  27 сентября
Место и время те же:
ШАД, ауд Стенфорд
Четверг, 19:00

Желающие выступить с докладом на семинаре могут записаться, написав мне здесь в телеграме.
Выступление на семинаре поможет вам самим подробнее разобраться с интересным материалом. Подготовка доклада и ответов на возможные вопросы позволяют заметить нюансы, незаметные при простом чтении статей.

Интересные темы для выступления можно найти, например, в чате https://t.me/rlpapers

На семинаре 27го числа выступлю я. Анонс выступления будет чуть позже!

Если у вас нет пропуска, не забудьте зарегистрироваться по ссылке до утра четверга :
https://docs.google.com/forms/d/e/1FAIpQLSd18PGkZuOqkWThJhmNxnmiSVFicnH4YwLVTCOkEkVQV6ZIDg/viewform

Ждем вас!
Dear all!
Напоминаю о том, что завтра состоится семинар группы.
На семинаре выступлю я с докладом по статье
Deep Reinforcement Learning in a Handful of Trials using Probabilistic Dynamics Models.

Приходите, будет интересно

Аннотация к выступлению:
Model-Based RL алгоритмы способны обучаться на малых количествах взаимодействия со средой, но при этом сильно уступают Model-Free алгоритмам в качестве.
Авторы предлагают метод Вероятностного Ансамблирования с Генератором Траекторий, который сочетает в себе модель динамики, избегающую неопреленности, с методом оценки неопределенности сэмплированием.
Метод достигает такого же качества, как и sota model-free алгоритмы за меньшее количество взаимодействий со средой.
Были проведены тесты на половинке гепарда, но об этом вы узнаете подробнее завтра.
источник

YY

Yulia Yakovleva 🚀🤔... in RL reading group
cydoroga
Dear all!
Напоминаю о том, что завтра состоится семинар группы.
На семинаре выступлю я с докладом по статье
Deep Reinforcement Learning in a Handful of Trials using Probabilistic Dynamics Models.

Приходите, будет интересно

Аннотация к выступлению:
Model-Based RL алгоритмы способны обучаться на малых количествах взаимодействия со средой, но при этом сильно уступают Model-Free алгоритмам в качестве.
Авторы предлагают метод Вероятностного Ансамблирования с Генератором Траекторий, который сочетает в себе модель динамики, избегающую неопреленности, с методом оценки неопределенности сэмплированием.
Метод достигает такого же качества, как и sota model-free алгоритмы за меньшее количество взаимодействий со средой.
Были проведены тесты на половинке гепарда, но об этом вы узнаете подробнее завтра.
Это вот она, да? https://arxiv.org/pdf/1805.12114.pdf
источник

c

cydoroga in RL reading group
Агаа
источник
2018 September 27

AG

Aleksey Grinchuk in RL reading group
Семинар в Кембридже, а не в Стэнфорде!
источник

AP

Anton Pechenko in RL reading group
Настраиваемся, трансляция будет
источник

AP

Anton Pechenko in RL reading group
я надеюсь что все видно/слышно
источник

AP

Anton Pechenko in RL reading group
источник

SI

Sergey Ivanov in RL reading group
всё видно и слышно, спасибо!
источник
2018 October 02

SK

Sergey Kolesnikov in RL reading group
немного пиара, но таки закончили EN версию за OpenAI Retro Contest
like, share, repost и похлопайте 50 раз, if u can 🙂

twitter: https://twitter.com/Scitator/status/1047099142303076352
medium: https://medium.com/swlh/at-the-speed-of-reinforcement-learning-an-openai-contest-story-6ed34fe7a3bb
источник

c

cydoroga in RL reading group
Sergey Kolesnikov
немного пиара, но таки закончили EN версию за OpenAI Retro Contest
like, share, repost и похлопайте 50 раз, if u can 🙂

twitter: https://twitter.com/Scitator/status/1047099142303076352
medium: https://medium.com/swlh/at-the-speed-of-reinforcement-learning-an-openai-contest-story-6ed34fe7a3bb
👏👏👏👏👏👏👏👏👏👏👏
Поздравления
Достойно
источник

SK

Sergey Kolesnikov in RL reading group
спасибо
источник