Телеграмм чат группы theoreticalrl страница 105

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

RL reading group

1092 membersпожаловаться на группу

2018 August 24

YY

Yulia Yakovleva 🚀🤔... in RL reading group

Сергей Власов

Всем привет, может кто подскажет статью с математикой беспилотных автомобилей, интересует как что там устроено, насколько я понимаю, некоторые вещи реализованы с помощью ML, а некоторые - традиционно - ПИД регуляторы, мб какие-то методы типа динамического окна

Привет!
На память приходит Stanley: The robot that won the DARPA Grand Challenge, но может быть она несколько устарела

источник

18:29пожаловаться #1

СВ

Сергей Власов... in RL reading group

Спс, глчну

источник

18:31пожаловаться #2

C

Constantine in RL reading group

https://selfdrivingcars.mit.edu/

MIT Deep Learning and Artificial Intelligence Lectures

MIT Deep Learning and Artificial Intelligence Lectures | Lex Fridman

A collection of lectures on deep learning, deep reinforcement learning, autonomous vehicles, and artificial intelligence organized by Lex Fridman.

источник

18:56пожаловаться #3

C

Constantine in RL reading group

предпоследняя лекция от чувака из nuAtonomy, начиная с 40-й минуты.

источник

18:56пожаловаться #4

YY

Yulia Yakovleva 🚀🤔... in RL reading group

Yulia Yakovleva 🚀🤔

Привет!
На память приходит Stanley: The robot that won the DARPA Grand Challenge, но может быть она несколько устарела

Этой статье оказывается лет 12, наверное коллеги могут что-то более современное посоветовать.

источник

18:57пожаловаться #5

C

Constantine in RL reading group

разные подходы есть. два экстрима: 1 - распознаем всю сцену, трекаем объекты, правилами описываем как надо рулить. 2 - ничего не описываем, загружаем тонну видео + сигналы от водителя, учим модель просто по картинке и датчикам.

источник

19:00пожаловаться #6

C

Constantine in RL reading group

обычно используют что-то посередине, ближе к 1-му (к примеру, яндекс)

источник

19:00пожаловаться #7

K

Kolyan in RL reading group

Тут Вячеслав Мурашкин неделю назад рассказывал про нейронки в беспилотниках
> Как беспилотные автомобили распознают 3D-объекты: обзор современных методов
https://youtu.be/zy9fxYDgUQw?t=7781

Data&Science: мир глазами роботов - Запись трансляции

Конференция посвящена одной из самых сложных задач искусственного интеллекта — распознаванию объектов и построению образов. Все доклады рассказывают про испо...

источник

20:47пожаловаться #8

2018 September 02

S

Shmuma in RL reading group

Вчера на DataScience Major была ссылка на работу https://arxiv.org/pdf/1712.00378.pdf (если я все правильно нагуглил). Не выходит из головы очевидность этой идеи, непонятно почему раньше на это не обратили внимание.

Если коротко: если окружение ограничено по времени каким-то количеством шагов, то нужно разделять ситуации когда время закончилось и когда агент что-то сделал не так. Решение простое -- если время заканчивается, то в беллмане нужно бутстрапить из Q-функции.

Скажем, в learning how to run, многие делали отрицательный reward за падение. Но по сути, это тот же способ обойти эту проблему, только костыльный (иначе говоря, теоретически необоснованный), что, по идее, может приводить к нестабильности обучения, так как в конце будут эпизоды доходящие до лимита по времени, и у них будет неправильный reference reward.

источник

10:04пожаловаться #9

2018 September 03

SA

See All in RL reading group

Ого, фб выложили свою либу и юзкейсы RL. Думаю, будет интересно :

https://facebookresearch.github.io/BlueWhale/docs/begin.html

источник

10:59пожаловаться #10

AR

Artem Ryzhikov in RL reading group

Как-то совсем не густо пока. Но будет интересно посмотреть, что будет дальше

источник

11:33пожаловаться #11

SK

Sergey Kolesnikov in RL reading group

мдя, что-то многие выкладывают свои фреймворки, но все еще слишком криво и слишком сложно
родные костыли - просто, надежно и быстро 🙂

источник

11:38пожаловаться #12

EZ

Evgenii Zheltonozhsk... in RL reading group

Sergey Kolesnikov

мдя, что-то многие выкладывают свои фреймворки, но все еще слишком криво и слишком сложно
родные костыли - просто, надежно и быстро 🙂

ну у каждого костыли по своему росту прост

источник

11:42пожаловаться #13

AR

Artem Ryzhikov in RL reading group

Если бы ребята что-то типа https://github.com/yandexdataschool/AgentNet для Pytorch'a выпустили с удобными реализациями памяти, аттеншнов и прочего, было бы клёво) Готовых алгоритм на пайторче уже итак большой зоопарк, а вот какого-то удобного RL-фреймворка поверх Pytorch я ещё не видел

yandexdataschool/AgentNet

Deep Reinforcement Learning library for humans. Contribute to yandexdataschool/AgentNet development by creating an account on GitHub.

источник

11:47пожаловаться #14

C

Constantine in RL reading group

@artemryzhikov там есть что-то нестандартное и интересное, кроме stack-augmented gru? Есть смысл переписывать?

источник

13:09пожаловаться #15

AR

Artem Ryzhikov in RL reading group

В ЛС написал, чтобы не флудить сильно тут

источник

13:20пожаловаться #16

SK

Sergey Kolesnikov in RL reading group

немного оффтоп за прошедший retro contest
https://habr.com/company/ods/blog/421585/

Как казаки retro контест решали

Весной этого года проходил знаменательный Retro Contest от OpenAI, который был посвящен обучению с подкреплением, meta learning и, конечно же, Sonic’у. Наша...

источник

13:30пожаловаться #17

SA

See All in RL reading group

Sergey Kolesnikov

немного оффтоп за прошедший retro contest
https://habr.com/company/ods/blog/421585/

Как казаки retro контест решали

Весной этого года проходил знаменательный Retro Contest от OpenAI, который был посвящен обучению с подкреплением, meta learning и, конечно же, Sonic’у. Наша...

Почему вы (?) В субботу не поехали в мейл?(

источник

13:31пожаловаться #18

SA

See All in RL reading group

Только ради рассказа ехал :/

источник

13:32пожаловаться #19

SK

Sergey Kolesnikov in RL reading group

у Миши случился форс-мажор в последний момент, пока перенесли на 15е + я уже буду готов все годно рассказать 🙂

источник

13:38пожаловаться #20