Size: a a a

RL reading group

2018 November 28

DN

Dmitry Nikulin in RL reading group
Sasha Malysheva
Привет
Мы пока не организовали трансляции
сейчас будет перерыв из-за NIPS, но с января мы организуем тг канал и будем туда выкладывать все семинары!:)

Ссылка — https://t.me/RL_SPB
Dratutee.
источник

AS

Artyom Sorokin in RL reading group
Sasha Malysheva
Привет
Мы пока не организовали трансляции
сейчас будет перерыв из-за NIPS, но с января мы организуем тг канал и будем туда выкладывать все семинары!:)

Ссылка — https://t.me/RL_SPB
Спасибо. А можно ещё в анонсах писать конкретнее что за статьи/методы будут разбираться?
источник
2018 November 29

SM

Sasha Malysheva in RL reading group
Artyom Sorokin
Спасибо. А можно ещё в анонсах писать конкретнее что за статьи/методы будут разбираться?
Хорошо:)
источник

IB

Ivan Belonogov in RL reading group
@sasha_malysheva а почему вы сделали канал? Там спросить ничего нельзя и участников не видно. Даже в этом чате 459 человек и он вроде не умирает от спама.
источник

SM

Sasha Malysheva in RL reading group
источник

SM

Sasha Malysheva in RL reading group
Наверное, стоит сделать чат :)
источник

AP

Anton Pechenko in RL reading group
источник

AP

Anton Pechenko in RL reading group
Похоже подъехало еще одно соревнование по RL и селф-драйвингу
источник

YY

Yulia Yakovleva 🚀🤔... in RL reading group
Очень круто!
источник

AP

Anton Pechenko in RL reading group
Ребята, хочу тут немного похайрить) Мы тут делаем робота на RL. Присоединяйтесь, если есть желание! Нам нужен еще один человек. Вот офрмальное описание вакансии https://spb.hh.ru/vacancy/29069747.
источник

SS

Sergey Sviridov in RL reading group
🔥
источник

MP

Monty Ponty in RL reading group
Добрый день, есть такой вопрос:
Допустим, есть два обученных агента для одной и той же среды. Какие есть методы ансамблирования для RL, чтобы у результирующего агента качество было лучше?
источник

SK

Sergey Kolesnikov in RL reading group
а какой action space?
источник

MP

Monty Ponty in RL reading group
Ну хотелось бы просто узнать методики и для дискретного и для непрерывного, даже если нету хорошо работающего на все возможные кейсы.
источник
2018 November 30

PS

Pavel Strunkin in RL reading group
Monty Ponty
Добрый день, есть такой вопрос:
Допустим, есть два обученных агента для одной и той же среды. Какие есть методы ансамблирования для RL, чтобы у результирующего агента качество было лучше?
вот статья в которой описывалось решение конкурсной задачи ML Boot Camp III
в ней автор использовал несколько моделей (как я понимаю это и есть ансамблирование)
ссылка на исходный код в статье
источник
2018 December 03

FF

Frank F in RL reading group
Подскажите пожалуйста.
Есть задача:
-множество условий
-выбираем одно из действий по выполнению набора условий
-получаем результат
-среда через некоторое время меняется и при таких же условиях мы можем получить другой результат
Вопросы :
1)Применимы ли методы Rl?
2) можно ли визуализировать в Ml-среде unity и как ?
Всем спасибо и удачи
источник

IK

Ivan Kapranov in RL reading group
Unity? Кто-то сказал Unity? Движок Unity?
источник

FF

Frank F in RL reading group
Ivan Kapranov
Unity? Кто-то сказал Unity? Движок Unity?
Ну у них целая библиотека unity Ml-Agents
источник

IK

Ivan Kapranov in RL reading group
Крч, да RL то работает, но только БЕГИ ОТ ЮНИТИ
источник

FF

Frank F in RL reading group
Ivan Kapranov
Крч, да RL то работает, но только БЕГИ ОТ ЮНИТИ
А почему ?
источник