Size: a a a

RL reading group

2017 October 30

АС

Артём С in RL reading group
https://www.reddit.com/r/MachineLearning/comments/79efus/r_on_the_information_bottleneck_theory_of_deep/
Вот тут говорят, что результаты Information Bottleneck статьи не воспроизводятся с relu активациями
источник

EZ

Evgenii Zheltonozhsk... in RL reading group
Артём С
https://www.reddit.com/r/MachineLearning/comments/79efus/r_on_the_information_bottleneck_theory_of_deep/
Вот тут говорят, что результаты Information Bottleneck статьи не воспроизводятся с relu активациями
омг
источник

EZ

Evgenii Zheltonozhsk... in RL reading group
тишби к нам приезжает через 3 недели
источник

📒

📒 in RL reading group
получается Tishby наверно все таки проверял на relu но утаил? жарко жарко в этом году на ICLR
источник

АС

Артём С in RL reading group
Может и не проверял, кто этих теоретиков знает
источник

AN

Alexander Novikov in RL reading group
источник

AN

Alexander Novikov in RL reading group
Надеюсь не полную глупость сказал, как это обычно бывает когда я пишу в интернете)
источник
2017 October 31

P

Pavel Shvechikov in RL reading group
Nice visual explanation of evolution strategies
http://blog.otoro.net/2017/10/29/visual-evolution-strategies/
источник

S

Sergey in RL reading group
arXiv:1710.04582v1  [cs.LG]  12 Oct 2017
Is Epicurus the father of Reinforcement Learning?
https://arxiv.org/pdf/1710.04582.pdf
источник
2017 November 01

P

Pavel Shvechikov in RL reading group
Коллеги, привет!

Завтра Nikita расскажет про Q-prop — о том, как сделать хоть насколько-нибудь надежным off-policy actor critic.  Эта статья получила oral на ICLR 2017.
В некотором смысле это будет продолжение доклада Артёма о стохастических нодах в вычислительных графах.
Также Nikita расскажет еще про ряд интересных достижений в RL, связанных с actor-critic (retrace + ACER).

Всем, у кого нет пропуска – зарегистрируйтесь пожалуйста до сегодняшнего вечера.
источник
2017 November 02

P

Pavel Shvechikov in RL reading group
[1710.11417] TreeQN and ATreeC: Differentiable Tree Planning for Deep Reinforcement Learning
https://arxiv.org/abs/1710.11417
источник

АК

Андрей Квасов... in RL reading group
Всем привет! А трансляцию сможет кто-нибудь организовать?
источник

AP

Anton Pechenko in RL reading group
Да, я смогу
источник

AF

Alexander Fritzler in RL reading group
А во сколько начало?
источник

АС

Артём С in RL reading group
19:00
источник

AG

Aleksey Grinchuk in RL reading group
Аудитория — Кембридж?
источник

AG

Alexander Grishin in RL reading group
Да
источник

АК

Андрей Квасов... in RL reading group
Антон, стабильно! Спасибо)
источник

NP

Nikita Petrenko in RL reading group
источник

AP

Anton Pechenko in RL reading group
источник