Телеграмм чат группы theoreticalrl страница 78

20:12пожаловаться #1

VY

Viktor Yanush in RL reading group

📒

Если там одна эпоха, то ему даже не пришлось ничего хранить. Пропустили батч и выбросили

20:29пожаловаться #2

📒

📒 in RL reading group

Viktor Yanush

Если там одна эпоха, то ему даже не пришлось ничего хранить. Пропустили батч и выбросили

это понятно, но на практике если подбирать разные модели автоинкодеров, то легче хранить, интересно сможет ли vq-vae вместе с mixture density rnn выучиться тоже

20:42пожаловаться #3

VY

Viktor Yanush in RL reading group

📒

это понятно, но на практике если подбирать разные модели автоинкодеров, то легче хранить, интересно сможет ли vq-vae вместе с mixture density rnn выучиться тоже

согласен

Если у Вас нет ШАДовского пропуска, и если Вы бы хотели посетить семинар, на котором разбираются статьи про RL, то эта форма – для Вас!

Несколько важных моментов:

1. Эту форму нужно будет заполнять КАЖДЫЙ РАЗ перед каждым семинаром, указывая дату предстоящего семинара

2. Отправлять форму нужно НЕ ПОЗЖЕ ВЕЧЕРА ДНЯ ПРЕДШЕСТВУЮЩЕГО СЕМИНАРУ (не позже среды, если семинар в чт). Если вдруг вы в день семинара поняли, что не успели отправить форму – пишите организаторам, что-нибудь придумаем!

3. В день семинара нужно ПРИХОДИТЬ С ПАСПОРТОМ. Без него могут не пустить.

20:42пожаловаться #4

2018 April 04

c

cydoroga in RL reading group

В этот четверг на семинаре выступит Алексей Гринчук
Начало в 19:00, аудитория Стенфорд, ШАД.

Не забудьте зарегистрироваться по ссылке до сегодняшней ночи , если хотите прийти:
https://docs.google.com/forms/d/e/1FAIpQLSd18PGkZuOqkWThJhmNxnmiSVFicnH4YwLVTCOkEkVQV6ZIDg/viewform

На семинаре будет разбираться статья про Soft Actor-Critic: https://arxiv.org/abs/1801.01290

Статья является follow upом одной из самых трендовых тем 2017 года по reinforcement learning, так называемой maximum entropy objective (это когда в награды добавляется добавка в виде энтропии политики) и различными “soft” методами, на ней основанными. В ходе семинара планируется:
1) Освежить знания по maximum entropy objective, теме, которую мы разбирали в несколько более общем виде в конце прошлого и начале этого года.
2) Разобраться с теоретическим обоснованием метода, изложенного в статье, после чего сделать переход от теории к практике.
3) Поглазеть на красивые графики, где новый метод всех побеждает и позиционирует себя новым state-of-the-art. Что интересно, также утверждается, что метод “is very stable, achieving very similar performance across different random seeds”, что для алгоритмов обучения с подкреплением большая редкость.

Приходите, будет интересно!

Google Docs

Deep RL reading group meeting

11:10пожаловаться #5

SK

Sergey Kolesnikov in RL reading group

чат и особенно @dudevil
я решил взять себя в руки и начать документировать наши семинары еще и заметками, чтобы потом расространять RL через ODS каналы (*смех доктора-зло*)
пока вот решил вспомнить Reproducible RL и немного набросал, прошу кинуть камень, если что не так
https://github.com/Scitator/papers/blob/master/papers/1708_reproducible_rl.md
@dudevil даешь право на редирект на тебя аки article reviewer'а?

Contribute to papers development by creating an account on GitHub.

22:23пожаловаться #6

SO

Sergey Ovcharenko in RL reading group

Конечно 👍

22:24пожаловаться #7

SO

Sergey Ovcharenko in RL reading group

Завтра почитаю

22:25пожаловаться #8

2018 April 05

SK

Sergey Kolesnikov in RL reading group

@cydoroga , now it's your turn
https://github.com/Scitator/papers/blob/master/papers/1802_me_trpo.md
куда можно на тебя редиректнуть как ревьюера?

из вопросов: авторы говорят, что перестают обучаться, когда более 70% симуляций с новой политикой - лучше старой....они это используют при обучении политик в псевдо-средах, или на реальной?

(если кто научит меня вставлять картинки в MD, чтобы их не разрывало - буду благодарен)

Contribute to papers development by creating an account on GitHub.

09:20пожаловаться #9

c

cydoroga in RL reading group

Sergey Kolesnikov

@cydoroga , now it's your turn
https://github.com/Scitator/papers/blob/master/papers/1802_me_trpo.md
куда можно на тебя редиректнуть как ревьюера?

из вопросов: авторы говорят, что перестают обучаться, когда более 70% симуляций с новой политикой - лучше старой....они это используют при обучении политик в псевдо-средах, или на реальной?

(если кто научит меня вставлять картинки в MD, чтобы их не разрывало - буду благодарен)

Contribute to papers development by creating an account on GitHub.

Гууд
Мыло ж нужно?
tpg.cydoroga@gmail.com
На вопрос чуть позже отвечу

10:24пожаловаться #10

AG

Aleksey Grinchuk in RL reading group

goo.gl/5K2r1x

Google Docs

soft_actor_critic.pdf

https://www.youtube.com/channel/UC6KYPBaACVG0pkBWH5bkWLQ/live

19:11пожаловаться #11

AP

Anton Pechenko in RL reading group

https://www.youtube.com/channel/UC6KYPBaACVG0pkBWH5bkWLQ/live

19:11пожаловаться #12

AP

Anton Pechenko in RL reading group

19:12пожаловаться #13

AP

Anton Pechenko in RL reading group

Видео, видно/слышно?

19:12пожаловаться #14

N

Nikki in RL reading group

Да, все супер!

https://blog.openai.com/retro-contest/

19:14пожаловаться #15

SK

Sergey Kolesnikov in RL reading group

OpenAI

Retro Contest

We're launching a transfer learning contest that measures a reinforcement learning algorithm's ability to generalize from previous experience.

23:31пожаловаться #16

2018 April 06

SO

Sergey Ovcharenko in RL reading group

Sergey Kolesnikov

чат и особенно @dudevil
я решил взять себя в руки и начать документировать наши семинары еще и заметками, чтобы потом расространять RL через ODS каналы (*смех доктора-зло*)
пока вот решил вспомнить Reproducible RL и немного набросал, прошу кинуть камень, если что не так
https://github.com/Scitator/papers/blob/master/papers/1708_reproducible_rl.md
@dudevil даешь право на редирект на тебя аки article reviewer'а?

Contribute to papers development by creating an account on GitHub.

ты не постил пока?
я бы в notes добавил "The need for standard well-tuned baseline algorithms for RL"

Evgenii Zheltonozhsk... in RL reading group

00:02пожаловаться #17

EZ

кто-то участвует?