И AlphaStar и вышеупомянутый SCC учились сначала человеческие игры возпроизводить. Потому что, с комбинаторными пространствами действий exploration за разумное время ничего не выдаст даже c огромными ресурсами.
И AlphaStar и вышеупомянутый SCC учились сначала человеческие игры возпроизводить. Потому что, с комбинаторными пространствами действий exploration за разумное время ничего не выдаст даже c огромными ресурсами.
Угумс. Статьи, которые про подобные игры, часто начинались со слов: взяли 100500 реплеев и предобучили)
Да. Забавно, что я тоже шел сюда использовать RL (Reinforcement Learning). Но чуть разобравшиcь c ограничениями, решил что RL для меня здесь будет Rust Language.