Size: a a a

RL reading group

2018 October 23

IB

Ivan Belonogov in RL reading group
Скорее мне не понятно каким образом всё это кормить в нейросеть. В целом есть много вариантов и нужно пробовать. Моя стратегия сейчас топ 10, но к машинному обучению она не имеет отношения.

Там можно команды делать. Если у кого-то есть опыт/желание прикрутить туда нейросети, то я бы это обсудил .
источник

SK

Sergey Kolesnikov in RL reading group
🤔если меня не разорвет и я выживу после нипс - пропингуй плиз в декабре. может даже будут какие baselines под это дело
источник

SK

Sergey Kolesnikov in RL reading group
ну и если кто готов подписаться на
https://www.pommerman.com
тоже пишите 🙂
но тут уж надо сейчас собираться
источник

SA

See All in RL reading group
Sergey Kolesnikov
ну и если кто готов подписаться на
https://www.pommerman.com
тоже пишите 🙂
но тут уж надо сейчас собираться
сейчас?) не в мае?)
источник

SK

Sergey Kolesnikov in RL reading group
сейчас, ибо Deadline: Nov 21st 2018
источник

IB

Ivan Belonogov in RL reading group
У меня сейчас есть время на halite. В декабре его скорее всего не будет.
источник

SK

Sergey Kolesnikov in RL reading group
halite я так и не смотрел, а bomberman - это чистый MARL с MCTS и вот этим всем
источник

IB

Ivan Belonogov in RL reading group
>>Proudly sponsored by Facebook AI Research, NVIDIA, Jane Street, and Google AI
Выглядит внушительно.
Я бы даже поучаствовал.
источник

C

Constantine in RL reading group
@Scitator да, там скорей всего какой-то вариант MC tree search пойдет. А ты уже начинал POMMERMAN?
источник

SK

Sergey Kolesnikov in RL reading group
:pepe-sad:, но так и не успел нормально начать – только потыкать чуток
catalyst и l2r'18 пока все пожирают
источник

C

Constantine in RL reading group
а что такое catalyst?
источник

SK

Sergey Kolesnikov in RL reading group
Constantine
а что такое catalyst?
ну, раз у ты спросил.... :kekeke:

https://github.com/Scitator/catalyst
источник

R

Roma in RL reading group
Constantine
@Scitator да, там скорей всего какой-то вариант MC tree search пойдет. А ты уже начинал POMMERMAN?
Разве тут MCTS  подойдет? Карты создаются динамически, соответственно дерево будет довольно широкое, а само обучение будет долгим.
источник

C

Constantine in RL reading group
@Scitator хе хе, пиарчик. думал что это соревнование. щас закину звезду.
источник

SK

Sergey Kolesnikov in RL reading group
хороший RL пиарчик будет после нипса, надеюсь
у меня там есть еще и приватный RL branch этой радости с домашним deepmind и прочими ништяками
источник

C

Constantine in RL reading group
а что, выходишь в топ на l2r? вообще очень круто.
источник

C

Constantine in RL reading group
@Rishchen да, думаю обучатся будет долго. а какие годные альтернативы?
источник

IB

Ivan Belonogov in RL reading group
что такое l2r?
источник

C

Constantine in RL reading group
источник

SK

Sergey Kolesnikov in RL reading group
про l2r вообще после НГ наверное будут кулстори
и за 17 и за 18 года, и за разницу, и вообще за RL конкурсы
источник