Телеграмм чат группы theoreticalrl страница 109

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

RL reading group

1092 membersпожаловаться на группу

2018 October 02

c

cydoroga in RL reading group

Всем привет!
В этот четверг на семинаре выступит Алексей Гринчук

Семинар будет посвящён maximum entropy RL и variational inference. Планируется разобрать две статьи: Soft Actor-Critic и Latent Space Policies for Hierarchical RL. SAC мы уже пытались разбирать, однако за прошедшее время изменилось несколько вещей:
1.Сильно изменился текст статьи на arxiv и авторская реализация алгоритма
2.Было проведено много экспериментов и разобраны некоторые тонкости реализации
3.Появилось понимание почему это круто и как можно сделать ещё круче
Кроме того, будет разобран follow-up с variational inference и hierarchical policies, в котором обсуждаются:
1. Как сформулировать задачу нахождения оптимальной политики при помощи графических моделей
2. Как и зачем строить многоуровневые иерархии политик

Место и время те же:
ШАД, ауд Стенфорд
Четверг, 19:00

Если у вас нет пропуска, не забудьте зарегистрироваться по ссылке до утра четверга :
https://docs.google.com/forms/d/e/1FAIpQLSd18PGkZuOqkWThJhmNxnmiSVFicnH4YwLVTCOkEkVQV6ZIDg/viewform

Приходите, будет интересно!

Deep RL reading group meeting

Если у Вас нет ШАДовского пропуска, и если Вы бы хотели посетить семинар, на котором разбираются статьи про RL, то эта форма – для Вас!

Несколько важных моментов:

1. Эту форму нужно будет заполнять КАЖДЫЙ РАЗ перед каждым семинаром, указывая дату предстоящего семинара

2. Отправлять форму нужно НЕ ПОЗЖЕ ВЕЧЕРА ДНЯ ПРЕДШЕСТВУЮЩЕГО СЕМИНАРУ (не позже среды, если семинар в чт). Если вдруг вы в день семинара поняли, что не успели отправить форму – пишите организаторам, что-нибудь придумаем!

3. В день семинара нужно ПРИХОДИТЬ С ПАСПОРТОМ. Без него могут не пустить.

источник

23:14пожаловаться #1

2018 October 03

c

cydoroga in RL reading group

Кто-нибудь может посоветовать простренькую среду РЛ с дискретными действиями и состоянием среды - картинкой, чтобы можно было сделать нормальный начальный эксплорейшн случайным выбором действий?

источник

11:26пожаловаться #2

📒

📒 in RL reading group

простенький лабиринт мб?

источник

11:27пожаловаться #3

SK

Sergey Kolesnikov in RL reading group

kung fu / space invaders?
с картинкой, с дискретными, но прямо чтобы простенькие.....ну, не совсем сложные 🙂

источник

11:29пожаловаться #4

AC

Artur Chakhvadze in RL reading group

Крестики-нолики?

источник

11:34пожаловаться #5

YY

Yulia Yakovleva 🚀🤔... in RL reading group

А змейка?

источник

12:26пожаловаться #6

c

cydoroga in RL reading group

Yulia Yakovleva 🚀🤔

А змейка?

Вот
Это наверное самое гуд
Спасибо)

источник

16:35пожаловаться #7

c

cydoroga in RL reading group

Всем привет!
В этот четверг на семинаре выступит Алексей Гринчук

Семинар будет посвящён maximum entropy RL и variational inference. Планируется разобрать две статьи: Soft Actor-Critic и Latent Space Policies for Hierarchical RL. SAC мы уже пытались разбирать, однако за прошедшее время изменилось несколько вещей:
1.Сильно изменился текст статьи на arxiv и авторская реализация алгоритма
2.Было проведено много экспериментов и разобраны некоторые тонкости реализации
3.Появилось понимание почему это круто и как можно сделать ещё круче
Кроме того, будет разобран follow-up с variational inference и hierarchical policies, в котором обсуждаются:
1. Как сформулировать задачу нахождения оптимальной политики при помощи графических моделей
2. Как и зачем строить многоуровневые иерархии политик

Место и время те же:
ШАД, ауд Стенфорд
Четверг, 19:00

Если у вас нет пропуска, не забудьте зарегистрироваться по ссылке до утра четверга :
https://docs.google.com/forms/d/e/1FAIpQLSd18PGkZuOqkWThJhmNxnmiSVFicnH4YwLVTCOkEkVQV6ZIDg/viewform

Приходите, будет интересно!

Deep RL reading group meeting

Если у Вас нет ШАДовского пропуска, и если Вы бы хотели посетить семинар, на котором разбираются статьи про RL, то эта форма – для Вас!

Несколько важных моментов:

1. Эту форму нужно будет заполнять КАЖДЫЙ РАЗ перед каждым семинаром, указывая дату предстоящего семинара

2. Отправлять форму нужно НЕ ПОЗЖЕ ВЕЧЕРА ДНЯ ПРЕДШЕСТВУЮЩЕГО СЕМИНАРУ (не позже среды, если семинар в чт). Если вдруг вы в день семинара поняли, что не успели отправить форму – пишите организаторам, что-нибудь придумаем!

3. В день семинара нужно ПРИХОДИТЬ С ПАСПОРТОМ. Без него могут не пустить.

Напоминаю, что если вы хотите прийти на семинар, но у вас нет пропуска в ШАД, то вам нужно зарегистрироваться по ссылке до 10 утра завтра

источник

19:40пожаловаться #8

2018 October 04

CP

Cherry Pie in RL reading group

Напоминаю, что если вы хотите прийти на семинар, но у вас нет пропуска в ШАД, то вам нужно зарегистрироваться по ссылке до 10 утра завтра

а что делать после регистрации? Как пройти без пропуска?

источник

17:03пожаловаться #9

МЗ

Матвей Зехов... in RL reading group

Говоришь охраннику на КПП что ты туда-то и туда-то, и если спросит показываешь паспорт

источник

17:10пожаловаться #10

CP

Cherry Pie in RL reading group

Ок, спасибо

источник

17:12пожаловаться #11

S

Shmuma in RL reading group

А будет ли трансляция/запись?

источник

18:40пожаловаться #12

c

cydoroga in RL reading group

Я мог бы на телефон записать, но это боль

источник

18:45пожаловаться #13

AP

Anton Pechenko in RL reading group

Трансляция будет

источник

18:47пожаловаться #14

S

Shmuma in RL reading group

Спасибо, добрый человек

источник

18:48пожаловаться #15

AP

Anton Pechenko in RL reading group

https://www.youtube.com/channel/UC6KYPBaACVG0pkBWH5bkWLQ/live

источник

19:04пожаловаться #16

AP

Anton Pechenko in RL reading group

Видно/слышно?

источник

19:04пожаловаться #17

VI

Valeriy Ischenko in RL reading group

Видно/слышно?

Да

источник

19:14пожаловаться #18

IM

Ilya Melnikov in RL reading group

Скиньте плиз почитать про гумбелевскую релаксацию, я не смог даже нагуглить, что это 😁

источник

19:45пожаловаться #19

V

Val in RL reading group

https://arxiv.org/abs/1611.00712

источник

19:46пожаловаться #20