Size: a a a

RL reading group

2018 October 02

c

cydoroga in RL reading group
Всем привет!
В этот четверг на семинаре выступит Алексей Гринчук

Семинар будет посвящён maximum entropy RL и variational inference. Планируется разобрать две статьи: Soft Actor-Critic и Latent Space Policies for Hierarchical RL. SAC мы уже пытались разбирать, однако за прошедшее время изменилось несколько вещей:
1.Сильно изменился текст статьи на arxiv и авторская реализация алгоритма
2.Было проведено много экспериментов и разобраны некоторые тонкости реализации
3.Появилось понимание почему это круто и как можно сделать ещё круче
Кроме того, будет разобран follow-up с variational inference и hierarchical policies, в котором обсуждаются:
1. Как сформулировать задачу нахождения оптимальной политики при помощи графических моделей
2. Как и зачем строить многоуровневые иерархии политик

Место и время те же:
ШАД, ауд Стенфорд
Четверг, 19:00

Если у вас нет пропуска, не забудьте зарегистрироваться по ссылке до утра четверга :
https://docs.google.com/forms/d/e/1FAIpQLSd18PGkZuOqkWThJhmNxnmiSVFicnH4YwLVTCOkEkVQV6ZIDg/viewform

Приходите, будет интересно!
источник
2018 October 03

c

cydoroga in RL reading group
Кто-нибудь может посоветовать простренькую среду РЛ с дискретными действиями и состоянием среды - картинкой, чтобы можно было сделать нормальный начальный эксплорейшн случайным выбором действий?
источник

📒

📒 in RL reading group
простенький лабиринт мб?
источник

SK

Sergey Kolesnikov in RL reading group
kung fu / space invaders?
с картинкой, с дискретными, но прямо чтобы простенькие.....ну, не совсем сложные 🙂
источник

AC

Artur Chakhvadze in RL reading group
Крестики-нолики?
источник

YY

Yulia Yakovleva 🚀🤔... in RL reading group
А змейка?
источник

c

cydoroga in RL reading group
Yulia Yakovleva 🚀🤔
А змейка?
Вот
Это наверное самое гуд
Спасибо)
источник

c

cydoroga in RL reading group
cydoroga
Всем привет!
В этот четверг на семинаре выступит Алексей Гринчук

Семинар будет посвящён maximum entropy RL и variational inference. Планируется разобрать две статьи: Soft Actor-Critic и Latent Space Policies for Hierarchical RL. SAC мы уже пытались разбирать, однако за прошедшее время изменилось несколько вещей:
1.Сильно изменился текст статьи на arxiv и авторская реализация алгоритма
2.Было проведено много экспериментов и разобраны некоторые тонкости реализации
3.Появилось понимание почему это круто и как можно сделать ещё круче
Кроме того, будет разобран follow-up с variational inference и hierarchical policies, в котором обсуждаются:
1. Как сформулировать задачу нахождения оптимальной политики при помощи графических моделей
2. Как и зачем строить многоуровневые иерархии политик

Место и время те же:
ШАД, ауд Стенфорд
Четверг, 19:00

Если у вас нет пропуска, не забудьте зарегистрироваться по ссылке до утра четверга :
https://docs.google.com/forms/d/e/1FAIpQLSd18PGkZuOqkWThJhmNxnmiSVFicnH4YwLVTCOkEkVQV6ZIDg/viewform

Приходите, будет интересно!
Напоминаю, что если вы хотите прийти на семинар, но у вас нет пропуска в ШАД, то вам нужно зарегистрироваться по ссылке до 10 утра завтра
источник
2018 October 04

CP

Cherry Pie in RL reading group
cydoroga
Напоминаю, что если вы хотите прийти на семинар, но у вас нет пропуска в ШАД, то вам нужно зарегистрироваться по ссылке до 10 утра завтра
а что делать после регистрации? Как пройти без пропуска?
источник

МЗ

Матвей Зехов... in RL reading group
Говоришь охраннику на КПП что ты туда-то и туда-то, и если спросит показываешь паспорт
источник

CP

Cherry Pie in RL reading group
Ок, спасибо
источник

S

Shmuma in RL reading group
А будет ли трансляция/запись?
источник

c

cydoroga in RL reading group
Я мог бы на телефон записать, но это боль
источник

AP

Anton Pechenko in RL reading group
Трансляция будет
источник

S

Shmuma in RL reading group
Спасибо, добрый человек
источник

AP

Anton Pechenko in RL reading group
источник

AP

Anton Pechenko in RL reading group
Видно/слышно?
источник

VI

Valeriy Ischenko in RL reading group
Anton Pechenko
Видно/слышно?
Да
источник

IM

Ilya Melnikov in RL reading group
Скиньте плиз почитать про гумбелевскую релаксацию, я не смог даже нагуглить, что это 😁
источник

V

Val in RL reading group
источник