Телеграмм чат группы theoreticalrl страница 72

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

RL reading group

1092 membersпожаловаться на группу

1
«
…
‹
67
68
69
70
71
72
73
›
…
»

2018 March 05

📒

📒 in RL reading group

Вот она: https://github.com/PacktPublishing/Practical-Deep-Reinforcement-Learning/blob/master/ch17/lib/i2a.py#L16

о круто что на торче книга надо добавить в awesome pytorch репозитории
седня делал neural episodic control, вроде это самый первый семинар, на питорче очень лекго получается, тянишь ближайших соседей из kd-дерева, оборачиваешь их nn.Parameter и все дифференцируется, а вот как такое сделать на tf я себе мало представляю

источник

22:27пожаловаться #1

DP

Dmitry Persiyanov in RL reading group

А есть эта книжка в пдф у кого-нибудь?

источник

23:31пожаловаться #2

DP

Dmitry Persiyanov in RL reading group

Переслано от Shmuma

Вот она: https://github.com/PacktPublishing/Practical-Deep-Reinforcement-Learning/blob/master/ch17/lib/i2a.py#L16

источник

23:31пожаловаться #3

SC

Sergey Cheparukhin in RL reading group

Можно у автора спросить. @Shmuma

источник

23:40пожаловаться #4

РК

Руслан Костоев... in RL reading group

is expected to be published in May 2018

источник

23:44пожаловаться #5

DP

Dmitry Persiyanov in RL reading group

Сорри, не заметил, что еще не вышла

источник

23:48пожаловаться #6

2018 March 06

S

Shmuma in RL reading group

Dmitry Persiyanov

А есть эта книжка в пдф у кого-нибудь?

Пока черновики только, будет финальный вариант - скину сюда

источник

08:52пожаловаться #7

2018 March 08

LG

Leonid Gremyachikh in RL reading group

Привет! Можете посоветовать статьи по методам RL в continuous state and continuous action spaces?

источник

19:45пожаловаться #8

AP

Anton Pechenko in RL reading group

D4PG, TRPO, PPO смотрел?

источник

19:48пожаловаться #9

LG

Leonid Gremyachikh in RL reading group

Я слышал что они хорошие результаты дают. Планирую рассмотреть. Хотел начать с чего-то простого (MCTS), чтобы использовать потом хотя бы как baseline.

источник

19:55пожаловаться #10

LG

Leonid Gremyachikh in RL reading group

@Parilo как Вы считаете, в этом есть смысл?

источник

19:56пожаловаться #11

AG

Aleksey Grinchuk in RL reading group

А какова постановка задачи? Если у нас нет модели среды, то MCTS не применим.

источник

19:57пожаловаться #12

LG

Leonid Gremyachikh in RL reading group

Модель среды как раз есть. Нужно сделать всего 2-3 действия.

источник

19:59пожаловаться #13

LG

Leonid Gremyachikh in RL reading group

Каждое - 4мерный вектор

источник

19:59пожаловаться #14

LG

Leonid Gremyachikh in RL reading group

Суть задачи- спутнику надо сделать несколько маневров, чтобы избежать столкновения с несколькими объектами космического мусора и вернуться на орбиту.

источник

20:04пожаловаться #15

AG

Aleksey Grinchuk in RL reading group

Честно говоря, я не представляю как MCTS применить в случае непрерывных действий. Я знаком с MCTS по статье про AlphaGo и там важно чтобы пространство действий было дискретным и не очень большим.

Наверное, лучше попробовать сначала алгоритмы, предложенные Антоном. Они хорошо работают на многих задачах continuous control.

источник

20:07пожаловаться #16

LG

Leonid Gremyachikh in RL reading group

Большое спасибо.

источник

20:09пожаловаться #17

MP

Mikhail Pavlov in RL reading group

я пробовал MCTS для непрерывных действий по этой статье https://www.ijcai.org/Proceedings/16/Papers/104.pdf, работало хуже чем model free методы, какие привел Антон. Но это было только на одной среде и вполне возможно, что где-то была ошибка.

источник

20:12пожаловаться #18

LG

Leonid Gremyachikh in RL reading group

да, вот как раз из-за этой статьи решил с MCTS начать.

источник

20:42пожаловаться #19

LG

Leonid Gremyachikh in RL reading group

+ еще вот эти

источник

20:42пожаловаться #20

1
«
…
‹
67
68
69
70
71
72
73
›
…
»