Телеграмм чат группы theoreticalrl страница 5

Участники семинара, есть к Вам большая просьба.
Пожалуйста, пишите свои впечатления о том, что можно бы сделать лучше при провдеении семинаров. Свои впечатления, пожелания. Важно, чтобы семинар был для всех максимально продуктивен.

источник

22:48пожаловаться #3

Just Heuristic in RL reading group

— а ещё тут кто-то просил ссылки на мою старую презу, простите что так долго

источник

23:02пожаловаться #4

Just Heuristic in RL reading group

afterburning_initial.pdf

(227.04 Кб)

источник

23:03пожаловаться #5

Pavel Shvechikov in RL reading group

Добавил ссылку на презентацию в гуглодок

источник

23:08пожаловаться #6

2017 June 23

📒

📒 in RL reading group

@justHeuristic преза топчик!

источник

04:46пожаловаться #7

Pavel Shvechikov in RL reading group

Вчера упоминали альтернативу max margin. Может кто-нибудь напомнить название?

источник

13:47пожаловаться #8

Dmitry Persiyanov in RL reading group

contrastive loss

источник

13:48пожаловаться #9

Pavel Shvechikov in RL reading group

Спасибо!

источник

13:58пожаловаться #10

2017 June 27

Pavel Shvechikov in RL reading group

Коллеги на этой неделе спецсеминара не будет.
Пишите мне, если хотите что-нибудь рассказать в следующий четверг.

источник

13:23пожаловаться #11

2017 June 29

Evgenii Zheltonozhsk... in RL reading group

вот еще интересная статья о learning to learn

источник

15:01пожаловаться #12

Evgenii Zheltonozhsk... in RL reading group

Learning to Learn without Gradient Descent by Gradient Descent https://arxiv.org/abs/1611.03824

источник

15:01пожаловаться #13

2017 July 03

Pavel Shvechikov in RL reading group

Evgenii Zheltonozhskii🇮🇱

Learning to Learn without Gradient Descent by Gradient Descent https://arxiv.org/abs/1611.03824

Спасибо за статью, интресно. Если кто-то расскажет об этом новом поделии Deepmind на нашем семинаре – будет очень круто. Все-таки exploration exploitation tradeoff непростая штука и их подход может быть весьма интересен.

источник

12:21пожаловаться #14

Dmitry Persiyanov in RL reading group

https://arxiv.org/pdf/1706.01427.pdf -- неплохая статья от DeepMind, говорят про то, как выучивать отношения между объектами и отвечать на вопросы об этих отношениях. Потенциально может быть применимо в RL, где хочется более глубоко понимать текущее состояние агента (типа отношения между пакманом и призраками/едой и т.д.)

источник

22:42пожаловаться #15

2017 July 04

Pavel Shvechikov in RL reading group

Да, ее очень интересно было бы послушать. Работа интересная. Есть желающие ее осветить?

источник

11:08пожаловаться #16

cydoroga in RL reading group

Интересная статья, спасибо
Видимо стало модным делать обучение на графах

источник

12:01пожаловаться #17

2017 July 05

Pavel Shvechikov in RL reading group

Господа, всем привет!
Завтра у нас планируется семинар из двух частей.
Сначала @fogside расскажет о работе OpenAI, в которой агенты тренируются на бинарном сравнении двух эпизодов, что избавляет человека от необходимости придумывать сложные функции награды для нетривиальных сред.
Затем @persiyanov расскажет про новую интереснейшую разработку DeepMind о relational reasoning.
Приходите, точно будет ооочень интересно! : )

На всякий случай, напоминаю, что сегодня последний день, когда можно заполнить заявку для того, чтобы вас завтра пропустили на охране.

источник

17:22пожаловаться #18

Alex Lu in RL reading group

А где проходит мероприятие?

источник

18:06пожаловаться #19

Mikhail Evseev in RL reading group

Alex Lu

А где проходит мероприятие?

ШАД

источник

18:32пожаловаться #20