Телеграмм чат группы theoreticalrl страница 153

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

RL reading group

1092 membersпожаловаться на группу

2019 July 24

C

Constantine in RL reading group

@lightcaster обучаемый симулятор не пробовали? Для самоездящих машинок это конечно довольно сложно, но для ходящих роботов есть вот такая статья https://arxiv.org/abs/1901.08652 неплохая

Learning agile and dynamic motor skills for legged robots

Legged robots pose one of the greatest challenges in robotics. Dynamic and
agile maneuvers of animals cannot be imitated by existing methods that are
crafted by humans. A compelling alternative is...

обучаемый симулятор это что? дифференцируемая среда? это было бы круто, но я таких не видел для наших задач. если просто обучать RL'ем в симуляторе и переносить, да, это пробуем.

источник

12:41пожаловаться #1

AP

Anton Pechenko in RL reading group

Нет, не обязательно дифференцируемый, просто за счёт обучения он ближе к реальности

источник

12:43пожаловаться #2

AP

Anton Pechenko in RL reading group

В статье как раз хороший пример этого. Но он не для вижна, а для динамики робота

источник

12:44пожаловаться #3

C

Constantine in RL reading group

да, я понял. не очень понятно на сколько sim2real у них этот стабильный. все что я пробовал пока - плохо работает. может дело как раз в том, что в реальном мире персепшн сильно другой, чем в симуляции.

источник

12:49пожаловаться #4

C

Constantine in RL reading group

но статья - топовая, спасибо.

источник

12:49пожаловаться #5

AP

Anton Pechenko in RL reading group

Они пишут что удалось сделать круче чем стандартное решение через дифуры (ну или как там эти шагающие роботы работают)

источник

12:51пожаловаться #6

C

Constantine in RL reading group

да, классический контрол и оптимизацию для таких штук сложно делать. boston dynamics пробует, но по-мне это тупиковый путь. попробую адаптировать то, что они делали. тем более с одним из авторов контакт есть :)

источник

12:56пожаловаться #7

2019 July 25

AG

Aleksey Grinchuk in RL reading group

https://blog.aqnichol.com/2019/07/24/competing-in-the-obstacle-tower-challenge/

источник

04:18пожаловаться #8

2019 July 27

AG

Aleksey Grinchuk in RL reading group

https://news.developer.nvidia.com/new-open-source-gpu-accelerated-atari-emulator-for-reinforcement-learning-now-available/

Порт Arcade Learning Environment на куду. Те, у кого нет кучи CPU чтоб гонять толпы агентов, могут делать это на одной GPU.

источник

00:54пожаловаться #9

A

Alexander O in RL reading group

там показывает FPS >4000 на gpu, а сколько на одном cpu? может там не cost effective решение получается. Хотя конечно обучать в один поток удобнее, чем при распараллеливании.

источник

02:00пожаловаться #10

DN

Dmitry Nikulin in RL reading group

Sergey Kolesnikov

btw, гайз, я там еще разок обновил RL list, теперь и алгоритмов больше учел и про основные фишечки подглядеть не забыл

https://docs.google.com/spreadsheets/d/1EeFPd-XIQ3mq_9snTlAZSsFY7Hbnmd7P5bbT8LPuMn0/edit?usp=sharing

Open-source RL

Frameworks

Execution,Algorithms (discrete / continuous / both),Additional features
Project,link,Maintainer,Framework,Parallel,Distributed,DQN,Rainbow,REINFORCE,A2C,PPO,DDPG,SAC,TD3,REINFORCE,A2C,PPO,TRPO,GAIL,n-step
return
<a href="https://github.com/openai/baselines">OpenAI baselines,<a hr...

Я всё ещё настаиваю на том, чтобы писать stable baselines рядом с baselines

источник

10:27пожаловаться #11

RS

Rinat Shigapov in RL reading group

да, классический контрол и оптимизацию для таких штук сложно делать. boston dynamics пробует, но по-мне это тупиковый путь. попробую адаптировать то, что они делали. тем более с одним из авторов контакт есть :)

Почему тупиковый?

Классический контрол - это то, что называется funnel control?

источник

20:53пожаловаться #12

SS

Sergey Sviridov in RL reading group

это то что называется optimal control

источник

20:55пожаловаться #13

2019 July 28

SK

Sergey Kolesnikov in RL reading group

Я всё ещё настаиваю на том, чтобы писать stable baselines рядом с baselines

но ведь так и есть

источник

10:17пожаловаться #14

DN

Dmitry Nikulin in RL reading group

Sergey Kolesnikov

но ведь так и есть

А, я на картинку в телеге посмотрел, сорри

источник

10:19пожаловаться #15

DN

Dmitry Nikulin in RL reading group

Обновил превьюшку

источник

10:26пожаловаться #16

S

Shmuma in RL reading group

Aleksey Grinchuk

https://news.developer.nvidia.com/new-open-source-gpu-accelerated-atari-emulator-for-reinforcement-learning-now-available/

Порт Arcade Learning Environment на куду. Те, у кого нет кучи CPU чтоб гонять толпы агентов, могут делать это на одной GPU.

Идея великолепная (сам ее вынашиваю почти год), вот только в репозиторий процентов 90 кода не доложили. Не может полный эмулятор атари состоять из десяти кб исходников.

источник

15:17пожаловаться #17

S

Shmuma in RL reading group

Вот, например, для сравнения, мой далеко еще недописанный эмулятор для pic32 https://github.com/Shmuma/basic-badge/tree/atari/firmware/badge1.X/src/atari

Shmuma/basic-badge

2018 Hackaday Belgrade Hardware Badge. Contribute to Shmuma/basic-badge development by creating an account on GitHub.

источник

15:20пожаловаться #18

DN

Dmitry Nikulin in RL reading group

Идея великолепная (сам ее вынашиваю почти год), вот только в репозиторий процентов 90 кода не доложили. Не может полный эмулятор атари состоять из десяти кб исходников.

Ага, я там ишью про это зарепортил

источник

15:37пожаловаться #19

2019 July 30

S

Shmuma in RL reading group

Ага, я там ишью про это зарепортил

Доложили файлов, теперь и смотреть можно.

источник

09:52пожаловаться #20