Size: a a a

RL reading group

2018 August 24

YY

Yulia Yakovleva 🚀🤔... in RL reading group
Сергей Власов
Всем привет, может кто подскажет статью с математикой беспилотных автомобилей, интересует как что там устроено, насколько я понимаю, некоторые вещи реализованы с помощью ML, а некоторые - традиционно - ПИД регуляторы, мб какие-то методы типа динамического окна
Привет!
На память приходит Stanley: The robot that won the DARPA Grand Challenge, но может быть она несколько устарела
источник

СВ

Сергей Власов... in RL reading group
Спс, глчну
источник

C

Constantine in RL reading group
источник

C

Constantine in RL reading group
предпоследняя лекция от чувака из nuAtonomy, начиная с 40-й минуты.
источник

YY

Yulia Yakovleva 🚀🤔... in RL reading group
Yulia Yakovleva 🚀🤔
Привет!
На память приходит Stanley: The robot that won the DARPA Grand Challenge, но может быть она несколько устарела
Этой статье оказывается лет 12, наверное коллеги могут что-то более современное посоветовать.
источник

C

Constantine in RL reading group
разные подходы есть. два экстрима: 1 - распознаем всю сцену, трекаем объекты, правилами описываем как надо рулить. 2 - ничего не описываем, загружаем тонну видео + сигналы от водителя, учим модель просто по картинке и датчикам.
источник

C

Constantine in RL reading group
обычно используют что-то посередине, ближе к 1-му (к примеру, яндекс)
источник

K

Kolyan in RL reading group
Тут Вячеслав Мурашкин неделю назад рассказывал про нейронки в беспилотниках
> Как беспилотные автомобили распознают 3D-объекты: обзор современных методов
https://youtu.be/zy9fxYDgUQw?t=7781
источник
2018 September 02

S

Shmuma in RL reading group
Вчера на DataScience Major была ссылка на работу https://arxiv.org/pdf/1712.00378.pdf (если я все правильно нагуглил). Не выходит из головы очевидность этой идеи, непонятно почему раньше на это не обратили внимание.

Если коротко: если окружение ограничено по времени каким-то количеством шагов, то нужно разделять ситуации когда время закончилось и когда агент что-то сделал не так. Решение простое -- если время заканчивается, то в беллмане нужно бутстрапить из Q-функции.

Скажем, в learning how to run, многие делали отрицательный reward за падение. Но по сути, это тот же способ обойти эту проблему, только костыльный (иначе говоря, теоретически необоснованный), что, по идее, может приводить к нестабильности обучения, так как в конце будут эпизоды доходящие до лимита по времени, и у них будет неправильный reference reward.
источник
2018 September 03

SA

See All in RL reading group
Ого, фб выложили свою либу и юзкейсы RL. Думаю, будет интересно :

https://facebookresearch.github.io/BlueWhale/docs/begin.html
источник

AR

Artem Ryzhikov in RL reading group
Как-то совсем не густо пока. Но будет интересно посмотреть, что будет дальше
источник

SK

Sergey Kolesnikov in RL reading group
мдя, что-то многие выкладывают свои фреймворки, но все еще слишком криво и слишком сложно
родные костыли - просто, надежно и быстро 🙂
источник

EZ

Evgenii Zheltonozhsk... in RL reading group
Sergey Kolesnikov
мдя, что-то многие выкладывают свои фреймворки, но все еще слишком криво и слишком сложно
родные костыли - просто, надежно и быстро 🙂
ну у каждого костыли по своему росту прост
источник

AR

Artem Ryzhikov in RL reading group
Если бы ребята что-то типа https://github.com/yandexdataschool/AgentNet для Pytorch'a выпустили с удобными реализациями памяти, аттеншнов и прочего, было бы клёво) Готовых алгоритм на пайторче уже итак большой зоопарк, а вот какого-то удобного RL-фреймворка поверх Pytorch я ещё не видел
источник

C

Constantine in RL reading group
@artemryzhikov там есть что-то нестандартное и интересное, кроме stack-augmented gru? Есть смысл переписывать?
источник

AR

Artem Ryzhikov in RL reading group
В ЛС написал, чтобы не флудить сильно тут
источник

SK

Sergey Kolesnikov in RL reading group
немного оффтоп за прошедший retro contest
https://habr.com/company/ods/blog/421585/
источник

SA

See All in RL reading group
Почему вы (?) В субботу не поехали в мейл?(
источник

SA

See All in RL reading group
Только ради рассказа ехал :/
источник

SK

Sergey Kolesnikov in RL reading group
у Миши случился форс-мажор в последний момент, пока перенесли на 15е + я уже буду готов все годно рассказать 🙂
источник