Наш чатик не сдается в борьбе за телеграм и завтра, как обычно, пройдет наш семинар:
В 19:00
ШАД, Стенфорд
На семинаре выступит Татьяна Савельева с докладом по статье Generative Multi-Agent Behavioral Cloning
Если у вас нет пропуска, не забудьте зарегистрироваться по ссылке до сегодняшней ночи:
https://docs.google.com/forms/d/e/1FAIpQLSd18PGkZuOqkWThJhmNxnmiSVFicnH4YwLVTCOkEkVQV6ZIDg/viewformВ современном RL становятся все более актуальными задачи, в которых необходимо моделирование поведения нескольких агентов одновременно. Например, в игре в баскетбол, игроки должны не просто хорошо играть по отдельности, но и уметь кооперироваться.
Авторы предлагают алгоритм, который позволяет генерировать правдоподобные траектории игроков на поле, оптимизировать совместное поведение игроков и осуществлять планирование на длительное время (с помощью макро-целей).
Алгоритм позволяет игрокам иметь несколько вариантов стратегии (мультимодальность), и превосходит другие методы в этой задаче.
Метод работает в стиле Behavioral Cloning и настраивается по имеющимся примерам взаимодействия со средой.
Приходите, будет интересно!