В этот четверг на семинаре выступит Алексей Гринчук
Начало в 19:00, аудитория Стенфорд, ШАД.
Не забудьте зарегистрироваться по ссылке до сегодняшней ночи , если хотите прийти:
https://docs.google.com/forms/d/e/1FAIpQLSd18PGkZuOqkWThJhmNxnmiSVFicnH4YwLVTCOkEkVQV6ZIDg/viewformНа семинаре будет разбираться статья про Soft Actor-Critic:
https://arxiv.org/abs/1801.01290Статья является follow upом одной из самых трендовых тем 2017 года по reinforcement learning, так называемой maximum entropy objective (это когда в награды добавляется добавка в виде энтропии политики) и различными “soft” методами, на ней основанными. В ходе семинара планируется:
1) Освежить знания по maximum entropy objective, теме, которую мы разбирали в несколько более общем виде в конце прошлого и начале этого года.
2) Разобраться с теоретическим обоснованием метода, изложенного в статье, после чего сделать переход от теории к практике.
3) Поглазеть на красивые графики, где новый метод всех побеждает и позиционирует себя новым state-of-the-art. Что интересно, также утверждается, что метод “is very stable, achieving very similar performance across different random seeds”, что для алгоритмов обучения с подкреплением большая редкость.
Приходите, будет интересно!