это будет третье соревнование, куда я хочу зайти с сетками. В позапрошлом думал об этом. В прошлом даже набросал API к среде для тренировки агента. В этой думаю даже до чего-то интереснее дойдёт
это будет третье соревнование, куда я хочу зайти с сетками. В позапрошлом думал об этом. В прошлом даже набросал API к среде для тренировки агента. В этой думаю даже до чего-то интереснее дойдёт
В итоге будет стохастическая физика с кучей агентов и играми по 10 минут)
Подавать ей на вход какой-то кусок карты, допустим 5х5
Проходить по всей карте целиком и находить ход с максимальной оценкой
conv2d на каждое маленькое поле с обычным увеличением количества фич Потом conv2d на 3х3 маленьких полей, тоже самое. И застакать этот слой, на выходе симметричный deconv. Обучать оценке из mcts