Телеграмм чат группы theoreticalrl страница 41

Китайцы хотели исследовать коммуникацию в мультиагентном RLе. И подвернулся под руку старкрафт комбат таск. Так уж вышло. А для игры в старкрафт в целом, полагаю, обойдутся без multiagent. Но скорее всего будут отдельные сетки для добычи ресурсов, строительства, собственно микроконтроля в бою.

источник

22:23пожаловаться #7

АК

Андрей Квасов... in RL reading group

А почему китайцы хотели исследовать ?

источник

22:34пожаловаться #8

Konstantin Ostrovsky in RL reading group

По поводу рекуррентных сетей в этом подходе. Внутренний слой у актора и у критика выглядит как развернутая двухнаправленная rnn. Т.е. как сеть рекуррентная по агентам. А по времени здесь рекуррентности нет.

источник

22:35пожаловаться #9

Konstantin Ostrovsky in RL reading group

Наверное посмотрели, что фейсбук в этом преуспел, и решили догонять :)

источник

22:36пожаловаться #10

2017 November 24

Pavel Shvechikov in RL reading group

Natural Value Approximators:
Learning when to Trust Past Estimates
http://papers.nips.cc/paper/6807-natural-value-approximators-learning-when-to-trust-past-estimates

Наконец-то! Я ждал подобной статьи уже давно. Обратили внимание на то, что функции ценности могут иметь резкие перепады при сколь угодно малом приращении.

papers.nips.cc

Natural value approximators: learning when to trust past estimates

Eletronic Proceedings of Neural Information Processing Systems

источник

18:39пожаловаться #11

Peter Romov in RL reading group

Ребят, а здесь есть тот кто сможет пропатчить обертку https://github.com/deepmind/pysc2 для работы в Agent-vs-Agent режиме? Оригинальное API поддерживает такой режим https://github.com/Blizzard/s2client-api

GitHub

deepmind/pysc2

StarCraft II Learning Environment. Contribute to deepmind/pysc2 development by creating an account on GitHub.

источник

18:45пожаловаться #12

Anton Pechenko in RL reading group

что ты имеешь в виду под пропатчить?

источник

18:59пожаловаться #13

Peter Romov in RL reading group

ээ

источник

19:00пожаловаться #14

Peter Romov in RL reading group

написать патч?

источник

19:00пожаловаться #15

Anton Pechenko in RL reading group

не то чтобы можно было взять и за 5 минут это сделать)

источник

19:10пожаловаться #16

Pika Chu in RL reading group

@romovpa Кхм-кхм. Вообще-то тебе нужна не deepmind'овская поделка, а бесценный оригинал.
https://github.com/Blizzard/s2client-proto/blob/master/docs/protocol.md#play-two-bots-against-each-other

GitHub

Blizzard/s2client-proto

StarCraft II Client - protocol definitions used to communicate with StarCraft II. - Blizzard/s2client-proto

источник

19:10пожаловаться #17

Peter Romov in RL reading group

Как вы наверное слышали, Blizzard с DeepMind сделали Learning Environment для StarCraft 2. Он работает на основе внешнего API игрового клиента — s2client-api, написанного на C++ близзами. Python-обертка для экспериментов от DM — pysc2, поддерживает только режим игры, когда агент играет с человеком, либо со стандартным внутриигровым ботом, при том что С++ интерфейс позволяет делать agent-vs-agent.
Задача в том, чтобы поправить библиотеку, так чтобы ее можно было использовать в agent-vs-agent режиме.

источник

19:11пожаловаться #18

Pika Chu in RL reading group

Ничего патчить в общем-то и не надо. Просто поправь конфиг.

источник

19:21пожаловаться #19

Peter Romov in RL reading group

Pika Chu

Ничего патчить в общем-то и не надо. Просто поправь конфиг.

Речь не про код близов, ребята из дипмайнда сказали что плюсовый код поддерживает. И задача в том, чтобы поправить обертку pysc2. https://github.com/deepmind/pysc2/issues/24

GitHub

Support Multiplayer · Issue #24 · deepmind/pysc2

I wrote my simple version of AI. And my friend wrote his own.
Is it possible to run one versus the other? Our only built-in one is now supported?
I read the documentation but didn't any way to do it.

источник

23:39пожаловаться #20