Size: a a a

AI Cups Official

2020 December 25

DK

Dmitriy Krylov in AI Cups Official
научить обыгрывать её
источник

DK

Dmitriy Krylov in AI Cups Official
а потом заставить играть саму с собой
источник

DK

Dmitriy Krylov in AI Cups Official
(в прочем так и делают обычно) за исключением, что иногда дают Pretrain
источник

AA

Artamonova A in AI Cups Official
она упрется в какую-то свою игру, а с нормальными стратками не вывезет
источник

DK

Dmitriy Krylov in AI Cups Official
Artamonova A
она упрется в какую-то свою игру, а с нормальными стратками не вывезет
зависит от уровня exploration
источник

DK

Dmitriy Krylov in AI Cups Official
тут скорее технически это реализовать сложно
источник

DK

Dmitriy Krylov in AI Cups Official
чтобы нормально обучать нужно, чтобы было  доступо две функции: функция награды и функция step
источник

DK

Dmitriy Krylov in AI Cups Official
если награду можно в самом простом случае считать как Delta по score с предыдущим тиком
источник

DK

Dmitriy Krylov in AI Cups Official
то со step возникают сложности в плане архитектуры
источник

DK

Dmitriy Krylov in AI Cups Official
нужно, чтобы эта функция принимала на вход action, например, бежать/атаковать для юнита, а на выходе выдавала награду после этого действия
источник

DK

Dmitriy Krylov in AI Cups Official
т.е с точки зрения архитектуры нужно посылать серверу action, получать от него Player.score и выдавать его от функции как награду
источник

DK

Dmitriy Krylov in AI Cups Official
с простыми нейронками гораздо проще, нужно просто запарсить логи и обучать предсказание action'a для юнита
источник

DK

Dmitriy Krylov in AI Cups Official
но если кто-то захочет заколлаборатиться над этим проектом с РЛ после соревнования, welcome
источник

ПЛ

Павел Любин... in AI Cups Official
Dmitriy Krylov
но если кто-то захочет заколлаборатиться над этим проектом с РЛ после соревнования, welcome
РЛ = reinforcement learning?
источник

ДК

Дмитрий Каштанов... in AI Cups Official
И AlphaStar и вышеупомянутый SCC учились сначала человеческие игры возпроизводить. Потому что, с комбинаторными пространствами действий exploration за разумное время ничего не выдаст даже c огромными ресурсами.
источник

A

Ariadne in AI Cups Official
я пробовала тут рл. Это жопа. Она с 0 не сходится, вообще
источник

ПЛ

Павел Любин... in AI Cups Official
Дмитрий Каштанов
И AlphaStar и вышеупомянутый SCC учились сначала человеческие игры возпроизводить. Потому что, с комбинаторными пространствами действий exploration за разумное время ничего не выдаст даже c огромными ресурсами.
Угумс. Статьи, которые про подобные игры, часто начинались со слов: взяли 100500 реплеев и предобучили)
источник

A

Ariadne in AI Cups Official
а адекватно предобучить супервайзд - не получится, ибо не на чем
источник

A

Ariadne in AI Cups Official
чтобы хотя бы учиться на своем, надо написать хотя бы одну страту, а я тупенькая
источник

ДК

Дмитрий Каштанов... in AI Cups Official
Павел Любин
РЛ = reinforcement learning?
Да. Забавно, что я тоже шел сюда использовать RL (Reinforcement Learning). Но чуть разобравшиcь c ограничениями, решил что RL для меня здесь будет Rust Language.
источник