Anton Chikin
Предоставим, что будет на выходе у нейросети? Самое простое - для каждого юнита вернуть некоторое распределение над возможными действиями. Тогда все юниты будут ходить независимо от выбранных действий других юнитов. В AlphaStar выбранные действия для одних юнитов подаются итеративно на вход сети, чтобы рассчитать действия остальных юнитов.
Так подожди, а что тебе мешает подавать на вход тензор [Nx10x10], где N - кол-во твоих юнитов, а в кач-ве аутпута N векторов, где каждый задаёт позицию куда идти, если в этой позиции есть юнит то его атаковать