Всем привет!
На этой неделе на семинаре выступит Жижин Петр, студент НИУ ВШЭ с докладом про Go-Explore
Четверг, ШАД
Аудитория: Стенфорд
19:00
Go-Explore — это новый алгоритм, разработанный Uber Research, который может решать задачи в средах с разряженными наградами. В статье рассматриваются недостатки существующих подходов, которые используют внутренние мотиваторы. А также предлагают новый механизм решения задач RL, который разделяет фазу исследования и непосредственно обучения. Из-за заявленного высокого качества, которое превышает способности экспертов-людей по Montezuma's Revenge, а так же больших ограничений на среду, данный алгоритм вызвал шквал бурных обсуждений на Reddit.
https://eng.uber.com/go-explore/Приходите, будет интересно!
ПС видео снимем и выложим в доступ на наш канал ютуб