Size: a a a

RL reading group

2017 November 02

AP

Anton Pechenko in RL reading group
трансляция
источник

AP

Anton Pechenko in RL reading group
Видно, слышно?
источник

NG

Nadezhda Goltsova in RL reading group
да
источник

P

Pavel Shvechikov in RL reading group
источник
2017 November 03

NP

Nikita Petrenko in RL reading group
Меня попросили прислать статьи, по которым я готовился. В порядке затраченного времени:

ACER:
https://arxiv.org/pdf/1611.01224.pdf

RETRACE:
https://arxiv.org/abs/1606.02647

Q-prop:
https://arxiv.org/abs/1611.02247

Interpolated Policy Gradient:
https://arxiv.org/abs/1706.00387

Q-lambda:
https://arxiv.org/abs/1602.04951
источник

NP

Nikita Petrenko in RL reading group
уточнил про связь q-lambda и gae-lambda - есть большие сомнения, что эта связь есть
источник

P

Pavel Shvechikov in RL reading group
Никита, спасибо! Доклад  был сложным и отлично подготовленным!
источник

G

G in RL reading group
Nikita Petrenko
Меня попросили прислать статьи, по которым я готовился. В порядке затраченного времени:

ACER:
https://arxiv.org/pdf/1611.01224.pdf

RETRACE:
https://arxiv.org/abs/1606.02647

Q-prop:
https://arxiv.org/abs/1611.02247

Interpolated Policy Gradient:
https://arxiv.org/abs/1706.00387

Q-lambda:
https://arxiv.org/abs/1602.04951
Nice
источник

AN

Aliaksandr Nekrashev... in RL reading group
источник
2017 November 04

EZ

Evgenii Zheltonozhsk... in RL reading group
Distributional Reinforcement Learning with Quantile Regression https://arxiv.org/abs/1710.10044
источник
2017 November 07

KB

Kirill Bobyrev in RL reading group
Появилась законченная версия "RL: An Introduction" от 5 ноября. Добавили в case study AlphaGo и AlphaGo Zero. UPD: На сайте Саттона драфт тоже обновился.
https://www.reddit.com/r/reinforcementlearning/comments/7b9cq6/reinforcement_learning_an_introduction_sutton/
источник
2017 November 08

P

Pavel Shvechikov in RL reading group
[1711.00832] A Unified Game-Theoretic Approach to Multiagent Reinforcement Learning
https://arxiv.org/abs/1711.00832
источник

P

Pavel Shvechikov in RL reading group
Господа, всем привет!

Завтра на семинаре будет два доклада. Оба немного нестандартные.

Сначала, @yanushviktor расскажет про горячую нынче тему -- оптимизацию с помощью обучения с подкреплением. В ходе рассказа  также будут затронуты наши давние друзья GPS, iLQG. Так что если давно хотелось понять, что это за звери, не пропустите завтрашний семинар!
Затем @omtcyfz расскажет про любопытную недавнюю поделку некого Sutton, в частности про обобщение многошагового Q-обучения.

ВСЕМ, КТО НЕ УСПЕЛ ЗАПОЛНИТЬ ЗАЯВКУ НА ПРОПУСК - самое время это сделать )
источник
2017 November 09

MK

Michael Konobeev in RL reading group
@yanushviktor, @omtcyfz можете, пожалуйста, записаться в таблицу с расписанием?
https://docs.google.com/spreadsheets/d/1ZeL1_mfR1ccwKKO_ihKs6R26pqy5bsJgU_t3jJjSN5c/edit#gid=1738423751
источник

AG

Aleksey Grinchuk in RL reading group
источник

AP

Anton Pechenko in RL reading group
источник

AP

Anton Pechenko in RL reading group
трансляция
источник

AP

Anton Pechenko in RL reading group
видно? слышно?
источник

IK

Ivan Kush in RL reading group
да
источник

VY

Viktor Yanush in RL reading group
Переслано от Viktor Yanush
источник