c
В этот четверг на семинаре выступит Алексей Гринчук
Семинар будет посвящён maximum entropy RL и variational inference. Планируется разобрать две статьи: Soft Actor-Critic и Latent Space Policies for Hierarchical RL. SAC мы уже пытались разбирать, однако за прошедшее время изменилось несколько вещей:
1.Сильно изменился текст статьи на arxiv и авторская реализация алгоритма
2.Было проведено много экспериментов и разобраны некоторые тонкости реализации
3.Появилось понимание почему это круто и как можно сделать ещё круче
Кроме того, будет разобран follow-up с variational inference и hierarchical policies, в котором обсуждаются:
1. Как сформулировать задачу нахождения оптимальной политики при помощи графических моделей
2. Как и зачем строить многоуровневые иерархии политик
Место и время те же:
ШАД, ауд Стенфорд
Четверг, 19:00
Если у вас нет пропуска, не забудьте зарегистрироваться по ссылке до утра четверга :
https://docs.google.com/forms/d/e/1FAIpQLSd18PGkZuOqkWThJhmNxnmiSVFicnH4YwLVTCOkEkVQV6ZIDg/viewform
Приходите, будет интересно!