Size: a a a

RL reading group

2018 February 23

АК

Андрей Квасов... in RL reading group
Всем здравствуйте!

Долгожданные праздники наступили, можно отдохнуть и сделать то, что всегда хотелось сделать - разобраться с интересными и известными статьями.

У нас есть два вакантных места для презентующих на следующей неделе и через две недели! Возможно у вас уже есть статья, которую бы вы хотели рассказать, или вы готовы прочитать и подготовить ее в ближайшую неделю-две - тогда пишите @kvandy, @cydoroga, чтобы договориться на 1 марта или 15 марта!

Информацию по подготовке вы можете найти по ссылке здесь goo.gl/ipG2KE , вкратце - мы ждем от вас качественного доклада, с львиной долей подробности о работе метода, его отличия от state-of-the-art и сложностях в работе с ним.

Конечно, многое зависит и от уровня изначальной статьи. Для этого у нас есть множество мест, куда скидываются отфильтрованные нашими участниками статьи! (см. в "полезные ссылки" goo.gl/ipG2KE ) Пользуйтесь ими для выбора темы презентации или просто как валидный источник статей для чтения!

Добавляйте больше статей, в которых вы уверены и сами заинтересованы.
Ждем всех, заинтересованных в теме Reinforcement Learning на наших семинарах, и ждем вашего активного участия!
источник
2018 February 26

AP

Alexander Pashevich in RL reading group
привет. может быть кто-то знает, какой сейчас SOTA в монтезуме? ссылка на пейпу была бы оч хэлпфул ☺
источник

P

Pavel Shvechikov in RL reading group
Мне казалось FeUdal networks до сих пор никто не побил. Поправьте, если это не так.
источник

AP

Alexander Pashevich in RL reading group
кажется, по числам у них не самый высокий результат
источник

AP

Alexander Pashevich in RL reading group
мне вообще эти графики одного рэндом сида доверия не внушают
источник

AP

Alexander Pashevich in RL reading group
особенно когда это дипмайнд, запускающий 1000+ рэндом сидов
источник

P

Pavel Shvechikov in RL reading group
Alexander Pashevich
кажется, по числам у них не самый высокий результат
А у кого лучше?
источник

AP

Alexander Pashevich in RL reading group
источник

P

Pavel Shvechikov in RL reading group
Да, согласен. Результаты побыстрее и получше.
источник

AP

Alexander Pashevich in RL reading group
наверняка есть что то еще лучше
источник

P

Pavel Shvechikov in RL reading group
Посмотри по цитатам лучшей из предложенных тобой. Если там нет, то думаю, что нет.
источник
2018 February 28

c

cydoroga in RL reading group
Коллеги, добрый вечер!
На этой и на следующей неделе семинара не будет.
Следующий состоится 15го числа.
Напоминаю, что мы очень рады желающим выступить. Пишите мне или @kvandy и занимайте статьи на обсуждение в таблице группы
источник
2018 March 02

EN

Evgenii Nikishin in RL reading group
кажется, OpenAI вернули поддержку gym’а
теперь gym.openai.com не перенаправляет на гитхаб, и gym.openai.com/envs показывает анимацию к существенной части игр
источник

JH

Just Heuristic in RL reading group
огонь! на следующий поток впилим gym.upload обратно
источник

EN

Evgenii Nikishin in RL reading group
что ещё нужно зафиксировать для воспроизводимости?
def set_seeds(env, seed):
   random.seed(seed)
   np.random.seed(seed)
   torch.manual_seed(seed)
   env.seed(seed)
источник

📒

📒 in RL reading group
if use_cuda: torch.cuda.manual_seed(seed)
источник

EN

Evgenii Nikishin in RL reading group
без куды пока
источник
2018 March 03

S

Shmuma in RL reading group
Evgenii Nikishin
кажется, OpenAI вернули поддержку gym’а
теперь gym.openai.com не перенаправляет на гитхаб, и gym.openai.com/envs показывает анимацию к существенной части игр
Нет, upload не вернули, просто сайт причесали. И, судя по тому что исчезла кнопка логина, scoreboard-а не планируется пока.
источник

KB

Kirill Bobyrev in RL reading group
Shmuma
Нет, upload не вернули, просто сайт причесали. И, судя по тому что исчезла кнопка логина, scoreboard-а не планируется пока.
источник

V

Vadim in RL reading group
Evgenii Nikishin
без куды пока
по моему это очень сложно сделать, если ты NN используешь
источник