Телеграмм чат группы theoreticalrl страница 88

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

RL reading group

1092 membersпожаловаться на группу

1
«
…
‹
83
84
85
86
87
88
89
›
…
»

2018 May 05

S

Shmuma in RL reading group

Нет, я пока собрал список желающих и отправил в издательство. Сейчас идет подготовка финальных драфтов, думаю это еще неделя-две, потом уже из издательства напишут

источник

13:10пожаловаться #1

LG

Leonid Gremyachikh in RL reading group

понял, спасибо.

источник

13:11пожаловаться #2

AA

Albert Atlasov in RL reading group

Это они читать или ревьюить? Седьмая глава большая, там страниц 40, что ли. Остальные по 20-25

Прочитать и потестить код 7 глав

источник

15:05пожаловаться #3

MY

Misha Yagudin in RL reading group

источник

17:30пожаловаться #4

MY

Misha Yagudin in RL reading group

источник

17:30пожаловаться #5

AM

Aleksandr Mikhailov ... in RL reading group

Кстати, кажется, тут почему-то не было: Facebook буквально несколько дней назад выкатил ELF OpenGo (https://research.fb.com/facebook-open-sources-elf-opengo/)

Пишут, что бот сыграл 198-2 с LeelaZero (наиболее сильная открытая реализация AlphaGo Zero на тот момент), 14-0 с топовыми мировыми игроками в Go, причём в процессе игры на prediction боту давалось 50 секунд на одной GPU, а людям — неограниченное количество времени для обдумывания хода.

Обновлённый ELF переехал в PyTorch (https://github.com/pytorch/elf).

Facebook Research

Facebook Open Sources ELF OpenGo - Facebook Research

Today, Facebook AI Research (FAIR) open sourced ELF OpenGo, an AI bot that has defeated world champion professional Go players,…

а в шахматы они осилили?

источник

20:49пожаловаться #6

AM

Aleksandr Mikhailov ... in RL reading group

чёт я бегло глянул, кажется что нет

источник

20:50пожаловаться #7

EZ

Evgenii Zheltonozhsk... in RL reading group

Aleksandr Mikhailov 😷

а в шахматы они осилили?

если они выкинут шахматную модель в опенсорс это будет бомба

источник

20:50пожаловаться #8

AM

Aleksandr Mikhailov ... in RL reading group

Evgenii Zheltonozhskii🇮🇱

если они выкинут шахматную модель в опенсорс это будет бомба

угу, я уже предвкушал, что сейчас скачаю, а фиг вам

источник

20:51пожаловаться #9

AM

Aleksandr Mikhailov ... in RL reading group

может они всё-таки не забросили, и шахматная модель уже учится/готовится к выкладке в опенсорс

источник

20:52пожаловаться #10

EZ

Evgenii Zheltonozhsk... in RL reading group

Aleksandr Mikhailov 😷

может они всё-таки не забросили, и шахматная модель уже учится/готовится к выкладке в опенсорс

просто шахматы сложнее)

источник

20:54пожаловаться #11

SK

Sergey Kolesnikov in RL reading group

товарищи, я тут решил world models почитать и вам советую
кто читал, можете меня пнуть, что я забыл/упустил:
https://github.com/Scitator/papers/blob/master/papers/1803_world_models.md

Scitator/papers

Contribute to Scitator/papers development by creating an account on GitHub.

источник

21:05пожаловаться #12

2018 May 06

S

Shmuma in RL reading group

@Scitator спасибо за обзор. Хотел что-то подобное в retro contest запилить

источник

19:26пожаловаться #13

SK

Sergey Kolesnikov in RL reading group

я тоже думал, но пришел к выводу, что подход может оказаться too complicated, с учётом времени на компетишен и надо пробовать что-то проще

источник

21:08пожаловаться #14

2018 May 09

KI

Karim Iskakov in RL reading group

ezgif-4-666c579fd9.mp4

"Current top entry on the @OpenAI Retro Contest Leaderboard has learned to glitch through a test level. Devious RL!"
👤 @jackclarkSF (twitter)
📉 @loss_function_porn

источник

18:23пожаловаться #15

c

cydoroga in RL reading group

Всем привет!
Завтра на семинаре выступлю я.
В ШАДе, в 19:00, ауд Стенфорд

Если у вас нет пропуска, не забудьте зарегистрироваться по ссылке до сегодняшней ночи :
https://docs.google.com/forms/d/e/1FAIpQLSd18PGkZuOqkWThJhmNxnmiSVFicnH4YwLVTCOkEkVQV6ZIDg/viewform

Доклад будет посвящен статье Latent Space Policies for Hierarchical Reinforcement Learning.

Мы поговорим о том, как задачу обучения с подкреплением описать с помощью направленной графической модели и как, далее, из этой постановки получить PG с максимизацией энтропии.
Изучим метод, позволяющий из получившейся графмодели сделать иерархическую политику, в которой изменения, вносимые низкоуровневыми действиями, обратимы и не понижают качество. Метод выглядит стройным и без обилия эвристик.

Приходите, будет интересно.

Deep RL reading group meeting

Если у Вас нет ШАДовского пропуска, и если Вы бы хотели посетить семинар, на котором разбираются статьи про RL, то эта форма – для Вас!

Несколько важных моментов:

1. Эту форму нужно будет заполнять КАЖДЫЙ РАЗ перед каждым семинаром, указывая дату предстоящего семинара

2. Отправлять форму нужно НЕ ПОЗЖЕ ВЕЧЕРА ДНЯ ПРЕДШЕСТВУЮЩЕГО СЕМИНАРУ (не позже среды, если семинар в чт). Если вдруг вы в день семинара поняли, что не успели отправить форму – пишите организаторам, что-нибудь придумаем!

3. В день семинара нужно ПРИХОДИТЬ С ПАСПОРТОМ. Без него могут не пустить.

источник

18:27пожаловаться #16

MG

Maria Garkavenko in RL reading group

Всем привет!
Завтра на семинаре выступлю я.
В ШАДе, в 19:00, ауд Стенфорд

Если у вас нет пропуска, не забудьте зарегистрироваться по ссылке до сегодняшней ночи :
https://docs.google.com/forms/d/e/1FAIpQLSd18PGkZuOqkWThJhmNxnmiSVFicnH4YwLVTCOkEkVQV6ZIDg/viewform

Доклад будет посвящен статье Latent Space Policies for Hierarchical Reinforcement Learning.

Мы поговорим о том, как задачу обучения с подкреплением описать с помощью направленной графической модели и как, далее, из этой постановки получить PG с максимизацией энтропии.
Изучим метод, позволяющий из получившейся графмодели сделать иерархическую политику, в которой изменения, вносимые низкоуровневыми действиями, обратимы и не понижают качество. Метод выглядит стройным и без обилия эвристик.

Приходите, будет интересно.

Deep RL reading group meeting

Если у Вас нет ШАДовского пропуска, и если Вы бы хотели посетить семинар, на котором разбираются статьи про RL, то эта форма – для Вас!

Несколько важных моментов:

1. Эту форму нужно будет заполнять КАЖДЫЙ РАЗ перед каждым семинаром, указывая дату предстоящего семинара

2. Отправлять форму нужно НЕ ПОЗЖЕ ВЕЧЕРА ДНЯ ПРЕДШЕСТВУЮЩЕГО СЕМИНАРУ (не позже среды, если семинар в чт). Если вдруг вы в день семинара поняли, что не успели отправить форму – пишите организаторам, что-нибудь придумаем!

3. В день семинара нужно ПРИХОДИТЬ С ПАСПОРТОМ. Без него могут не пустить.

а видео будет?

источник

18:49пожаловаться #17

c

cydoroga in RL reading group

Maria Garkavenko

а видео будет?

Зависит, видимо, от того, придет ли @Parilo или @Shmuma завтра

источник

19:09пожаловаться #18

S

Shmuma in RL reading group

Да, запишем

источник

19:22пожаловаться #19

AP

Anton Pechenko in RL reading group

Я буду, да

источник

19:22пожаловаться #20

1
«
…
‹
83
84
85
86
87
88
89
›
…
»