Всем привет!
Завтра на семинаре выступлю я.
В ШАДе, в 19:00, ауд Стенфорд
Если у вас нет пропуска, не забудьте зарегистрироваться по ссылке до сегодняшней ночи :
https://docs.google.com/forms/d/e/1FAIpQLSd18PGkZuOqkWThJhmNxnmiSVFicnH4YwLVTCOkEkVQV6ZIDg/viewformДоклад будет посвящен статье Latent Space Policies for Hierarchical Reinforcement Learning.
Мы поговорим о том, как задачу обучения с подкреплением описать с помощью направленной графической модели и как, далее, из этой постановки получить PG с максимизацией энтропии.
Изучим метод, позволяющий из получившейся графмодели сделать иерархическую политику, в которой изменения, вносимые низкоуровневыми действиями, обратимы и не понижают качество. Метод выглядит стройным и без обилия эвристик.
Приходите, будет интересно.