Телеграмм чат группы theoreticalrl страница 116

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

RL reading group

1092 membersпожаловаться на группу

2018 November 08

TG

Tatiana Gaintseva in RL reading group

Блин, я понимаю, что это уже становится смешным, но я вынужден отменить семинар ещё раз
Прошу прощения
У меня тут проблемы с соседями дома поскольку течёт труба и я их топлю
И сейчас необходимо решать эту проблему и я не могу чисто физически приехать
Ещё раз прошу прощения, мне очень стыдно за эту ситуацию, но не могу ее сейчас решить иначе

может, дублера на всякий случай назначать всегда?)

источник

18:45пожаловаться #1

2018 November 09

YG

Yury Gorishniy in RL reading group

https://blog.openai.com/spinning-up-in-deep-rl/

Spinning Up in Deep RL

We’re releasing Spinning Up in Deep RL, an educational resource designed to let anyone learn to become a skilled practitioner in deep reinforcement learning. Spinning Up consists of crystal-clear examples of RL code, educational exercises, documentation, and tutorials.

источник

00:55пожаловаться #2

SK

Sergey Kolesnikov in RL reading group

внезапно, @rl_agent можешь кинуть исходники презы про SAC свои?

источник

14:14пожаловаться #3

2018 November 13

S

Shmuma in RL reading group

Вопрос про грядущий четверг: 2b || ~2b?

источник

17:16пожаловаться #4

AP

Anton Pechenko in RL reading group

выражение всегда True

источник

17:17пожаловаться #5

AP

Anton Pechenko in RL reading group

источник

17:17пожаловаться #6

S

Shmuma in RL reading group

В качестве запасного доклада могу предложить повторить свое выступление на sbdj в прошлую субботу (тема "rl в web-навигации"). Если интересно, конечно :)

источник

17:18пожаловаться #7

S

Shmuma in RL reading group

выражение всегда True

Многие философские школы имеют свое мнение на этот спорный вопрос :)

источник

17:18пожаловаться #8

AP

Anton Pechenko in RL reading group

Окай)

источник

17:19пожаловаться #9

2018 November 14

SA

See All in RL reading group

Welcome to Spinning Up in Deep RL! — Spinning Up documentation
https://spinningup.openai.com/en/latest/

источник

12:26пожаловаться #10

SA

See All in RL reading group

Давно эта дока появилась, я слоупок, да?

источник

12:26пожаловаться #11

AG

Artem Grachev in RL reading group

ну с недельку типо…

источник

12:27пожаловаться #12

AG

Artem Grachev in RL reading group

+-

источник

12:27пожаловаться #13

c

cydoroga in RL reading group

Всем привет!
Завтра на семинаре выступит Максим Лапань (@Shmuma ) с темой: Deep RL в навигации по сайтам
Как обычно:
ШАД, Стенфорд, Четверг, 19:00

Аннотация:
В обучении с подкреплением пока не очень много примеров практически значимых применений, что вовсе не означает что RL бесполезен или годится только для обучения нейросетей играть в старые игрушки.

В своем докладе Максим подробно разберет использование современного обучения с подкреплением в одном из ключевых проектов компании -- системе извлечения данных с сайтов отелей.

Приходите, будет интересно!

Если у вас нет пропуска в ШАД, не забудьте зарегистрироваться по ссылке до завтра, до 12ти утра:
https://docs.google.com/forms/d/e/1FAIpQLSd18PGkZuOqkWThJhmNxnmiSVFicnH4YwLVTCOkEkVQV6ZIDg/viewform

Deep RL reading group meeting

Если у Вас нет ШАДовского пропуска, и если Вы бы хотели посетить семинар, на котором разбираются статьи про RL, то эта форма – для Вас!

Несколько важных моментов:

1. Эту форму нужно будет заполнять КАЖДЫЙ РАЗ перед каждым семинаром, указывая дату предстоящего семинара

2. Отправлять форму нужно НЕ ПОЗЖЕ ВЕЧЕРА ДНЯ ПРЕДШЕСТВУЮЩЕГО СЕМИНАРУ (не позже среды, если семинар в чт). Если вдруг вы в день семинара поняли, что не успели отправить форму – пишите организаторам, что-нибудь придумаем!

3. В день семинара нужно ПРИХОДИТЬ С ПАСПОРТОМ. Без него могут не пустить.

источник

16:07пожаловаться #14

qw

q w in RL reading group

Ребят, я не особо слежу за современным RL, я немного из другой области. У меня такой вопрос, а есть ли RL методы, которые под капотом применяют техники из области автоматических рассуждений? Ну там, SMT солверы например? И будет ли умный RL агент применять что-то более-менее рациональное если ему встретится комбинаторная подзадача? Например, если мы переформулируем задачу решения судоку в термины RL, то будет ли агент применять что-то более-менее умное?

источник

16:14пожаловаться #15

AP

Anton Pechenko in RL reading group

Что такое судоку я не знаю, но ты смотрел на AlphaGo Zero?

источник

16:15пожаловаться #16

АС

Артём С in RL reading group

Ребят, я не особо слежу за современным RL, я немного из другой области. У меня такой вопрос, а есть ли RL методы, которые под капотом применяют техники из области автоматических рассуждений? Ну там, SMT солверы например? И будет ли умный RL агент применять что-то более-менее рациональное если ему встретится комбинаторная подзадача? Например, если мы переформулируем задачу решения судоку в термины RL, то будет ли агент применять что-то более-менее умное?

Большинство современных методов использует нейросети и градиентный спуск, а эти вещи плохо дружат с дискретными процессами (вроде SMT солверов)

источник

16:18пожаловаться #17

C

Constantine in RL reading group

https://homes.cs.washington.edu/~bornholt/post/nnsmt.html

homes.cs.washington.edu

Can you train a neural network using SMT?

Yes, and I did, but you shouldn’t.

источник

16:21пожаловаться #18

qw

q w in RL reading group

AlphaGo Zero крутой, но на сколько я понял он заточен только на дискретный мир, и не может , например играть в Марио. И если пространство действий непрерывное, то всё ещё хуже. А вот так, чтобы скрестить что-то настолько мощное как AlphaGo Zero с чем-то настолько общим как A3C? В общем умное как AlphaGo Zero с непрерывным миром и непрерывным пространством действий?

Я подумал вот о чём: можно же использовать ML чтобы извлекать правила мира, а затем уже последовательность действий искать с помощью SMT. И хочу понять, эта идея нова, или нет?

источник

16:27пожаловаться #19

c

cydoroga in RL reading group

AlphaGo Zero крутой, но на сколько я понял он заточен только на дискретный мир, и не может , например играть в Марио. И если пространство действий непрерывное, то всё ещё хуже. А вот так, чтобы скрестить что-то настолько мощное как AlphaGo Zero с чем-то настолько общим как A3C? В общем умное как AlphaGo Zero с непрерывным миром и непрерывным пространством действий?

Я подумал вот о чём: можно же использовать ML чтобы извлекать правила мира, а затем уже последовательность действий искать с помощью SMT. И хочу понять, эта идея нова, или нет?

Велком в мир model-based rl

источник

16:29пожаловаться #20