Телеграмм чат группы theoreticalrl страница 148

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

RL reading group

1092 membersпожаловаться на группу

2019 June 30

P

Pavel Shvechikov in RL reading group

Классика — атари на one frame per step + flickering (на вход черный экран с вероятностью 0.5)
Альтернативы — VIzdoom, среды из DMLab (почти все, но особенно pool — круглый бассейн, где выключили свет и нужно найти маячок, ориентируясь только по стенам)

источник

18:23пожаловаться #1

2019 July 01

K

Kolyan in RL reading group

> RL станет темой номер 1 в 2020-м году
а к этому есть предпосылки? что-то недавно кардинально улучшилось?

источник

19:59пожаловаться #2

П

Пётр in RL reading group

Ставлю, что темой номер 1 или GANы или адверсариал будут.

источник

19:59пожаловаться #3

A

Alexander O in RL reading group

Количество выступлений в RL reading group почему-то значительно меньше, чем в прошлом году.

источник

20:00пожаловаться #4

A

Alexander O in RL reading group

есть дискорд RL group, где участников много, но постов все равно не так много как хотелось бы https://discord.gg/QQ2btK

Join the RL Group Discord Server!

Check out the RL Group community on Discord - hang out with 481 other members and enjoy free voice and text chat.

источник

20:01пожаловаться #5

AS

Artyom Sorokin in RL reading group

> что-то недавно кардинально улучшилось?
Алгоритмы играют лучше вроде, но не то что бы какой-то прорыв был их скорее теперь тренеруют не по 80кк(A3C, DQN) шагов, а по 10ккк(R2D2, APE-X) шагов и все распределенное.

источник

20:03пожаловаться #6

EZ

Evgenii Zheltonozhsk... in RL reading group

> что-то недавно кардинально улучшилось?
Алгоритмы играют лучше вроде, но не то что бы какой-то прорыв был их скорее теперь тренеруют не по 80кк(A3C, DQN) шагов, а по 10ккк(R2D2, APE-X) шагов и все распределенное.

То есть ещё меньше людей могут в соту)

источник

20:03пожаловаться #7

AS

Artyom Sorokin in RL reading group

Да, я уже какую статью высаживаюсь.
»Ой смотрите какой у нас высокий score в монтезума!! Теперь решить эту задачу гораздо легче, нужно всего лишь тренировать агента 2 миллиарда шагов!
» У нас высочайший скор на atari 57! После 10 миллиардов шагов!
И все это с графиками которые не по количеству апдейтов сети, и не по шагам взаимодействия со средой, а wall time на гугловских суперкомпьютерах...

источник

20:08пожаловаться #8

MG

Maria Garkavenko in RL reading group

Да, я уже какую статью высаживаюсь.
»Ой смотрите какой у нас высокий score в монтезума!! Теперь решить эту задачу гораздо легче, нужно всего лишь тренировать агента 2 миллиарда шагов!
» У нас высочайший скор на atari 57! После 10 миллиардов шагов!
И все это с графиками которые не по количеству апдейтов сети, и не по шагам взаимодействия со средой, а wall time на гугловских суперкомпьютерах...

Графики по wall time? Мда далеко там рл ушёл, пока я за ним не следила

источник

20:32пожаловаться #9

A

Alexander O in RL reading group

Мне кажется аргумент про то, что это группа в 500 человек не очень релевантный. Так на любой пост можно сказать, что он не всем релевантный и давайте его удалять. Я считаю, что и так тут прямо мало сообщений, на столько человек, обычно в группах поменьше и по 100 сообщений в день идет, а тут не так часто. Я думаю, что у всех и так канал этот замютен, а основные сообщения-обьявления можно через pin-сообщений доносить.

источник

20:44пожаловаться #10

c

cydoroga in RL reading group

Коллеги, прошу, пожалуйста, остановить дискуссию
Мое личное мнение, что не очень хорошо рекламировать в одном чате просто другие чаты без каких-то дополнительных штук
Это не ссылки на имплементации, не осмысленное обсуждение
Мне кажется, явных предпосылок переходить на дискорд на данный момент нет

источник

20:44пожаловаться #11

2019 July 03

P

Pavel Shvechikov in RL reading group

Ребята, а кто-какие знает руководства по reward engineering? Интересует все — начиная от дизайна наград для произвольной новой среды, заканчивая преобразованиями наград перед тем, как пихать в RL алгоритм.
reward shaping (NG, 1999) и всякие Human Compatible AI papers не предлагать.

источник

13:20пожаловаться #12

AP

Alexey Poddiachyi in RL reading group

Pavel Shvechikov

Ребята, а кто-какие знает руководства по reward engineering? Интересует все — начиная от дизайна наград для произвольной новой среды, заканчивая преобразованиями наград перед тем, как пихать в RL алгоритм.
reward shaping (NG, 1999) и всякие Human Compatible AI papers не предлагать.

На курсере есть Practical Reinforcement Learning. Там пару лекций этому посвящено. Обзорно, конечно, но достаточно полезно. И там же пару статей они приводят на эту тему.

источник

13:48пожаловаться #13

P

Pavel Shvechikov in RL reading group

Alexey Poddiachyi

На курсере есть Practical Reinforcement Learning. Там пару лекций этому посвящено. Обзорно, конечно, но достаточно полезно. И там же пару статей они приводят на эту тему.

Если бы еще не я их читал (

источник

13:49пожаловаться #14

CP

Cherry Pie in RL reading group

Это очень забавно, когда одному из создателей курса предлагают посмотреть свой же курс

источник

13:50пожаловаться #15

АС

Артём С in RL reading group

Ну мало ли, вдруг забыл! Люди блоги заводят, чтобы для самих себя заметки на будущее делать, может Паша для этого видеокурс сделал

источник

13:52пожаловаться #16

AP

Alexey Poddiachyi in RL reading group

Ахаха, сори, даже не смотрел на имя

источник

13:57пожаловаться #17

2019 July 04

DN

Dmitry Nikulin in RL reading group

Pavel Shvechikov

Ребята, а кто-какие знает руководства по reward engineering? Интересует все — начиная от дизайна наград для произвольной новой среды, заканчивая преобразованиями наград перед тем, как пихать в RL алгоритм.
reward shaping (NG, 1999) и всякие Human Compatible AI papers не предлагать.

А что плохого в этих статьях? Не считая того, что список устарел на два года

источник

02:51пожаловаться #18

P

Pavel Shvechikov in RL reading group

А что плохого в этих статьях? Не считая того, что список устарел на два года

Конкретно эти не смотрел.
Обычно статьи от них наполнены философией будущего, а не технической информацией.

источник

04:58пожаловаться #19

2019 July 05

P

Pavel Shvechikov in RL reading group

Переслано от Dmitry Nikulin

Было бы очень круто tldr для всего этого, хотя бы пару предложений

источник

12:28пожаловаться #20