Size: a a a

RL reading group

2017 November 29

C

Constantine in RL reading group
0:00:04           Score: None
######   #   #.  #   #########
        b   #   #   #    .  #
#   #  .#####   # . #   #####
#.P # .    .    #   #  .
##################   # . #####
#       .         . #   #   .
# . #################   #####
    #     . .       #  .
#########   #####   #########
 .  #   .   #       #  .  .
источник

C

Constantine in RL reading group
что-то в этом роде. бегаешь по лабиринтам, собираешь бонусы. с виду просто, но нетривиально - информация неполна, нужна "память".
источник

P

Pavel Shvechikov in RL reading group
Коллеги, всем привет!

Завтра, как и ожидалось, у нас будут два доклада.
Сначала Aleksey закончит рассказ про AlphaGo Zero, затем @artemryzhikov расскажет про редкое явление - бустинг для оценки функции ценности (ICML17).

Напоминаю, что регистироваться на пропуск нужно до конца сегодняшнего дня.
источник
2017 November 30

EZ

Evgenii Zheltonozhsk... in RL reading group
One-Shot Reinforcement Learning for Robot Navigation with Interactive Replay https://arxiv.org/abs/1711.10137
источник

AP

Anton Pechenko in RL reading group
может кому-то будет интересно
источник

AP

Anton Pechenko in RL reading group
источник

AP

Anton Pechenko in RL reading group
мой небольшой видео-отчетик об участии в соревновании
источник

AP

Anton Pechenko in RL reading group
источник

AP

Anton Pechenko in RL reading group
видно слышно?
источник

EN

Evgenii Nikishin in RL reading group
источник

АК

Андрей Квасов... in RL reading group
Да, все слышно! Спасибо)
источник

EZ

Evgenii Zheltonozhsk... in RL reading group
Action Branching Architectures for Deep Reinforcement Learning https://arxiv.org/abs/1711.08946
источник
2017 December 01

P

Pavel Shvechikov in RL reading group
Коллеги, наблюдение за семинаром  показало ряд интересных вещей.
1. К началу декабря видимо мы подустали и регулярняй поток людей на семинарах истощился.
2. Толково и с пониманием дела мы за один семинар можем разобраться только одну статью. На вторую, как правило, не хватает времени у докладчика и сил у слушателей.

Поэтому попробуем новый формат докладов - только одну статью за доклад, но разбираться внимательно и с пристрастем.  Также следующую неделю мы пропустим.
источник

VR

Victor Rudnev in RL reading group
Simple Nearest Neighbor Policy Method for Continuous Control Tasks
https://openreview.net/forum?id=ByL48G-AW
источник

EZ

Evgenii Zheltonozhsk... in RL reading group
источник

VR

Victor Rudnev in RL reading group
Victor Rudnev
Simple Nearest Neighbor Policy Method for Continuous Control Tasks
https://openreview.net/forum?id=ByL48G-AW
Напоминает прошлогоднюю https://arxiv.org/abs/1606.04460 , где NN был по латентному пространству VAE
источник

P

Pavel Shvechikov in RL reading group
А вот и Беркли со своей любимой темой
http://bair.berkeley.edu/blog/2017/11/30/model-based-rl/
источник
2017 December 04

IK

Ivan Kush in RL reading group
источник
2017 December 05

EZ

Evgenii Zheltonozhsk... in RL reading group
Efficient exploration with Double Uncertain Value Networks https://arxiv.org/abs/1711.10789
источник
2017 December 06

DP

Dmitry Persiyanov in RL reading group
NIPS2017: Teaching Machines to Describe Images via Natural Language Feedback
https://arxiv.org/pdf/1706.00130.pdf
источник