Size: a a a

RL reading group

2017 June 22

ŽC

Ženja 🐲 Che in RL reading group
Спасибо:)
источник

ŽC

Ženja 🐲 Che in RL reading group
Pavel Shvechikov
Вроде они были выложены до начала семинара по ссылке с выступлениями (прикреплена)
Извините, я не видела.
источник

P

Pavel Shvechikov in RL reading group
Участники семинара, есть к Вам большая просьба.
Пожалуйста, пишите свои впечатления о том, что можно бы сделать лучше при провдеении семинаров. Свои впечатления, пожелания. Важно, чтобы семинар был для всех максимально продуктивен.
источник

JH

Just Heuristic in RL reading group
— а ещё тут кто-то просил ссылки на мою старую презу, простите что так долго
источник

JH

Just Heuristic in RL reading group
источник

P

Pavel Shvechikov in RL reading group
Добавил ссылку на презентацию в гуглодок
источник
2017 June 23

📒

📒 in RL reading group
@justHeuristic преза топчик!
источник

P

Pavel Shvechikov in RL reading group
Вчера упоминали альтернативу max margin. Может кто-нибудь напомнить название?
источник

DP

Dmitry Persiyanov in RL reading group
contrastive loss
источник

P

Pavel Shvechikov in RL reading group
Спасибо!
источник
2017 June 27

P

Pavel Shvechikov in RL reading group
Коллеги на этой неделе спецсеминара не будет.
Пишите мне, если хотите что-нибудь рассказать в следующий четверг.
источник
2017 June 29

EZ

Evgenii Zheltonozhsk... in RL reading group
вот еще интересная статья о learning to learn
источник

EZ

Evgenii Zheltonozhsk... in RL reading group
Learning to Learn without Gradient Descent by Gradient Descent https://arxiv.org/abs/1611.03824
источник
2017 July 03

P

Pavel Shvechikov in RL reading group
Evgenii Zheltonozhskii🇮🇱
Learning to Learn without Gradient Descent by Gradient Descent https://arxiv.org/abs/1611.03824
Спасибо за статью, интресно. Если кто-то расскажет об этом новом поделии Deepmind на нашем семинаре – будет очень круто. Все-таки exploration exploitation tradeoff непростая штука и их подход может быть весьма интересен.
источник

DP

Dmitry Persiyanov in RL reading group
https://arxiv.org/pdf/1706.01427.pdf -- неплохая статья от DeepMind, говорят про то, как выучивать отношения между объектами и отвечать на вопросы об этих отношениях. Потенциально может быть применимо в RL, где хочется более глубоко понимать текущее состояние агента (типа отношения между пакманом и призраками/едой и т.д.)
источник
2017 July 04

P

Pavel Shvechikov in RL reading group
Да, ее очень интересно было бы послушать. Работа интересная. Есть желающие ее осветить?
источник

c

cydoroga in RL reading group
Интересная статья, спасибо
Видимо стало модным делать обучение на графах
источник
2017 July 05

P

Pavel Shvechikov in RL reading group
Господа, всем привет!
Завтра у нас планируется семинар из двух частей.
Сначала @fogside расскажет о работе OpenAI, в которой агенты тренируются на бинарном сравнении двух эпизодов, что избавляет человека от необходимости придумывать сложные функции награды для нетривиальных сред.
Затем @persiyanov расскажет про новую интереснейшую разработку DeepMind о relational reasoning.
Приходите, точно будет ооочень интересно! : )

На всякий случай, напоминаю, что сегодня последний день, когда можно заполнить заявку для того, чтобы вас завтра пропустили на охране.
источник

AL

Alex Lu in RL reading group
А где проходит мероприятие?
источник

ME

Mikhail Evseev in RL reading group
Alex Lu
А где проходит мероприятие?
ШАД
источник