Телеграмм чат группы theoreticalrl страница 34

Size: a a a

RL reading group

2017 October 30

АС

https://www.reddit.com/r/MachineLearning/comments/79efus/r_on_the_information_bottleneck_theory_of_deep/
Вот тут говорят, что результаты Information Bottleneck статьи не воспроизводятся с relu активациями

[R] On the Information Bottleneck Theory of Deep Learning...

Posted in r/MachineLearning by u/ajmooch • 70 points and 36 comments

источник

09:53пожаловаться #1

Evgenii Zheltonozhsk... in RL reading group

Артём С

[R] On the Information Bottleneck Theory of Deep Learning...

Posted in r/MachineLearning by u/ajmooch • 70 points and 36 comments

омг

источник

10:02пожаловаться #2

Evgenii Zheltonozhsk... in RL reading group

тишби к нам приезжает через 3 недели

источник

10:03пожаловаться #3

📒

📒 in RL reading group

получается Tishby наверно все таки проверял на relu но утаил? жарко жарко в этом году на ICLR

источник

10:03пожаловаться #4

АС

Артём С in RL reading group

Может и не проверял, кто этих теоретиков знает

источник

10:04пожаловаться #5

Alexander Novikov in RL reading group

Мои мысли на этот счет: https://www.reddit.com/r/MachineLearning/comments/79efus/r_on_the_information_bottleneck_theory_of_deep/dp32r6i/

[R] On the Information Bottleneck Theory of... • r/MachineLearning

57 points and 26 comments so far on reddit

источник

10:21пожаловаться #6

Alexander Novikov in RL reading group

Надеюсь не полную глупость сказал, как это обычно бывает когда я пишу в интернете)

источник

10:23пожаловаться #7

2017 October 31

Pavel Shvechikov in RL reading group

Nice visual explanation of evolution strategies
http://blog.otoro.net/2017/10/29/visual-evolution-strategies/

大トロ・ Machine Learning

A Visual Guide to Evolution Strategies

источник

14:54пожаловаться #8

Sergey in RL reading group

arXiv:1710.04582v1 [cs.LG] 12 Oct 2017
Is Epicurus the father of Reinforcement Learning?
https://arxiv.org/pdf/1710.04582.pdf

источник

18:06пожаловаться #9

2017 November 01

Pavel Shvechikov in RL reading group

Коллеги, привет!

Завтра Nikita расскажет про Q-prop — о том, как сделать хоть насколько-нибудь надежным off-policy actor critic. Эта статья получила oral на ICLR 2017.
В некотором смысле это будет продолжение доклада Артёма о стохастических нодах в вычислительных графах.
Также Nikita расскажет еще про ряд интересных достижений в RL, связанных с actor-critic (retrace + ACER).

Всем, у кого нет пропуска – зарегистрируйтесь пожалуйста до сегодняшнего вечера.

источник

20:32пожаловаться #10

2017 November 02

Pavel Shvechikov in RL reading group

[1710.11417] TreeQN and ATreeC: Differentiable Tree Planning for Deep Reinforcement Learning
https://arxiv.org/abs/1710.11417

источник

15:55пожаловаться #11

АК

Андрей Квасов... in RL reading group

Всем привет! А трансляцию сможет кто-нибудь организовать?

источник

17:57пожаловаться #12