Телеграмм чат группы theoreticalrl страница 35

Появилась законченная версия "RL: An Introduction" от 5 ноября. Добавили в case study AlphaGo и AlphaGo Zero. UPD: На сайте Саттона драфт тоже обновился.
https://www.reddit.com/r/reinforcementlearning/comments/7b9cq6/reinforcement_learning_an_introduction_sutton/

_Reinforcement Learning: An... • r/reinforcementlearning

5 points and 1 comments so far on reddit

источник

07:37пожаловаться #11

2017 November 08

Pavel Shvechikov in RL reading group

[1711.00832] A Unified Game-Theoretic Approach to Multiagent Reinforcement Learning
https://arxiv.org/abs/1711.00832

источник

14:07пожаловаться #12

Pavel Shvechikov in RL reading group

Господа, всем привет!

Завтра на семинаре будет два доклада. Оба немного нестандартные.

Сначала, @yanushviktor расскажет про горячую нынче тему -- оптимизацию с помощью обучения с подкреплением. В ходе рассказа также будут затронуты наши давние друзья GPS, iLQG. Так что если давно хотелось понять, что это за звери, не пропустите завтрашний семинар!
Затем @omtcyfz расскажет про любопытную недавнюю поделку некого Sutton, в частности про обобщение многошагового Q-обучения.

ВСЕМ, КТО НЕ УСПЕЛ ЗАПОЛНИТЬ ЗАЯВКУ НА ПРОПУСК - самое время это сделать )

источник

21:53пожаловаться #13

2017 November 09

Michael Konobeev in RL reading group

@yanushviktor, @omtcyfz можете, пожалуйста, записаться в таблицу с расписанием?
https://docs.google.com/spreadsheets/d/1ZeL1_mfR1ccwKKO_ihKs6R26pqy5bsJgU_t3jJjSN5c/edit#gid=1738423751

Google Docs

Deep RL reading group.ods

Deep RL

Paper,When,Where,Who,Notes,Presentations
<a href="https://arxiv.org/abs/1703.01988">Neural Episodic Control,19:00 08.06.2017 ,ШАД, Гарвард,Никишин,This paper is one of the recent silent breakthroughs to intellectual agent with human-like memory,<a href="https://yadi.sk/i/wXGVGqp-3Jx...

источник

11:11пожаловаться #14

Aleksey Grinchuk in RL reading group

https://www.nytimes.com/2017/11/06/technology/artificial-intelligence-start-up.html