Size: a a a

RL reading group

2018 December 19

VK

Vlad Kurenkov in RL reading group
Sergey Sviridov
Random Network Distillation
Ага
источник

SK

Sergey Kolesnikov in RL reading group
аа, ну это монтезума 🙂
источник

📒

📒 in RL reading group
у дэвида силвера был слайд прикольный
источник

YY

Yulia Yakovleva 🚀🤔... in RL reading group
📒
у дэвида силвера был слайд прикольный
А можно ссылку на источник?
источник

📒

📒 in RL reading group
источник

YY

Yulia Yakovleva 🚀🤔... in RL reading group
Спасибо!
источник
2018 December 20

EB

Evgeny Burnaev in RL reading group
Коллеги! Какой ник у Александра Панина?
источник

EN

Evgenii Nikishin in RL reading group
источник

JH

Just Heuristic in RL reading group
угу-сь
источник
2018 December 21

c

cydoroga in RL reading group
ВНИМАНИЕ, ВАЖНОЕ ОБЪЯВЛЕНИЕ!!!

Всем привет!
Предлагаю выбираться из докладного застоя.
Чтобы организовать постоянные выступления, предлагаю совместно вести таблицу выступающих.

Таблица устроена проще некуда. Три поля: дата, имя, тема доклада.
Права на редактирование открыты всем.
Просьба не удалять уже записавшихся 😄
https://docs.google.com/spreadsheets/d/1ULg_NJ8ncDyluvLXmgyX9YiOdKGd4Kh-D6GNWC61Arc/edit?usp=sharing

Чтобы избежать перебоев таблицу имеет смысл заполнять сильно заранее.
Сейчас предлагаю внести имена на числа, начиная с 31го января (!)
То есть на февраль.
В 20х числах января отроется запись на март.

Все, кто хотел бы выступить в феврале (начиная с 31го января), можете занимать слоты в таблице. Если есть желание выступить раньше, пишите мне.

И еще, предлагаю пройти опрос:
https://goo.gl/forms/sPwRAjZfGZp4MgUO2

Спасибо!
источник

AM

Aleksandr Mikhailov ... in RL reading group
cydoroga
ВНИМАНИЕ, ВАЖНОЕ ОБЪЯВЛЕНИЕ!!!

Всем привет!
Предлагаю выбираться из докладного застоя.
Чтобы организовать постоянные выступления, предлагаю совместно вести таблицу выступающих.

Таблица устроена проще некуда. Три поля: дата, имя, тема доклада.
Права на редактирование открыты всем.
Просьба не удалять уже записавшихся 😄
https://docs.google.com/spreadsheets/d/1ULg_NJ8ncDyluvLXmgyX9YiOdKGd4Kh-D6GNWC61Arc/edit?usp=sharing

Чтобы избежать перебоев таблицу имеет смысл заполнять сильно заранее.
Сейчас предлагаю внести имена на числа, начиная с 31го января (!)
То есть на февраль.
В 20х числах января отроется запись на март.

Все, кто хотел бы выступить в феврале (начиная с 31го января), можете занимать слоты в таблице. Если есть желание выступить раньше, пишите мне.

И еще, предлагаю пройти опрос:
https://goo.gl/forms/sPwRAjZfGZp4MgUO2

Спасибо!
кажется прав всё же нет
источник

AM

Aleksandr Mikhailov ... in RL reading group
источник

c

cydoroga in RL reading group
Попробуй ещё разок
источник

AM

Aleksandr Mikhailov ... in RL reading group
cydoroga
Попробуй ещё разок
👍
источник
2019 January 08

S

Shmuma in RL reading group
Участвует кто-нибудь в этом безобразии? https://selfdrivingcars.mit.edu/deeptraffic/
Полчаса поковырял, пока одно впечатление: "сначала переписать все на питон, только потом что-нибудь можно делать"
источник

AP

Anton Pechenko in RL reading group
я два года назад просто затюнил дефолтные параметры и был в топе
источник

AP

Anton Pechenko in RL reading group
обучалось довольно быстро проямо в браузере
источник

S

Shmuma in RL reading group
это-то всегда можно. Хотелось как-то более систематично подойти к процессу :)
источник
2019 January 28

ОС

Олег Свидченко... in RL reading group
Питерские семинары ожили)
источник

ОС

Олег Свидченко... in RL reading group
Анонс семинара 29.01

За последние несколько лет глубокое обучение с подкреплением помогло добиться выдающихся успехов в самых различных областях. Последние работы по этой теме уже исследуют обучение вне спектра привычных нам задач с одним агентом, а рассматривают мультиагентное обучение. Задачи обучения с несколькими агентами существенно сложнее, и для их решения требуются новые более трудоемкие методы и алгоритмы.

На семинаре мы взглянем на полную картину глубокого мультиагентного обучения с подкреплением. Мы рассмотрим несколько категорий задач из этой области, увидим, как методы глубокого обучения и мультиагентного обучения дополняют друг друга и помогают решать поставленные задачи, разберем state-of-the-art алгоритмы и узнаем об открытых вопросах области.

Докладчик: Федорова Анна
Статья: https://arxiv.org/abs/1810.05587v1
источник