Size: a a a

AI Cups Official

2020 December 25

DK

Dmitriy Krylov in AI Cups Official
Anton Chikin
Во, у тебя будет распределение действий для каждого юнита. Тебе сеть вернёт, что для юнита A1 можно отойти или атаковать и для юнита A2 можно отойти или атаковать. Но сеть ничего не скажет о том, что лучше или вместе отходить или вместе атаковать
Можно сделать ещё иерархию, РЛ которая будет давать верхнеуровневые команды вроде всем юнитам двигать в точку А, фокусировать юнита Б
источник

AA

Artamonova A in AI Cups Official
SilentNox
Это число надо будет домножить на количество вариантов содержимого клетки. У нас 10 типов сущностей, плюс две стороны, итого 20 входов на клетку.
и все равно будет играть хуже ифов))
т.к. радиус 5 это уже радиус атаки, а тот же раб должен отбежать за пару тиков раньше, чтобы найти себе новое занятие
источник

DK

Dmitriy Krylov in AI Cups Official
А потом когда начнется бой отдавать управлению другим, которые будут уже микрить
источник

S

SilentNox in AI Cups Official
Artamonova A
и все равно будет играть хуже ифов))
т.к. радиус 5 это уже радиус атаки, а тот же раб должен отбежать за пару тиков раньше, чтобы найти себе новое занятие
В этом вся проблема нейронок...
источник

AC

Anton Chikin in AI Cups Official
Dmitriy Krylov
А потом когда начнется бой отдавать управлению другим, которые будут уже микрить
Да, так мне кажется проще научить чему-то осмысленному
источник

DK

Dmitriy Krylov in AI Cups Official
SilentNox
Это число надо будет домножить на количество вариантов содержимого клетки. У нас 10 типов сущностей, плюс две стороны, итого 20 входов на клетку.
Для начала можно предложить, что все юниты лучники, тогда будет только два варианта клеток лучники и непроходимые
источник

DK

Dmitriy Krylov in AI Cups Official
Anton Chikin
Да, так мне кажется проще научить чему-то осмысленному
Ещё очень много геморроя будет с дизайном функции награды
источник

ST

Sergio Tulentsev in AI Cups Official
Дмитрий Каштанов
Чуть больше разобравшись с ограничениями, понял, что с ними Rust здесь - это язык второго класса. Одна надежда, что в следующем году будет возможность свои контейнеры делать с более разумными ограничениями.
Например, что за ограничения?
источник

AC

Anton Chikin in AI Cups Official
Dmitriy Krylov
Ещё очень много геморроя будет с дизайном функции награды
Я попробовал просто score в качестве награды. Рабочие достаточно быстро начинают учиться ходить и собирать ресурсы
источник

S

SilentNox in AI Cups Official
Anton Chikin
Я попробовал просто score в качестве награды. Рабочие достаточно быстро начинают учиться ходить и собирать ресурсы
Ты уже пробовал нейронку делать?
источник

S

SilentNox in AI Cups Official
Как учил, в таком случае?
источник

AC

Anton Chikin in AI Cups Official
SilentNox
Ты уже пробовал нейронку делать?
Да, взял U-Net, который формирует многомерное потенциальное поле. Далее для каждого юнита рассчитывал вероятность действий на основании значения ПП в окрестности юнита. Далее реализовал алгоритм Policy Gradient
источник

DK

Dmitriy Krylov in AI Cups Official
А зачем u-net?
источник

S

SilentNox in AI Cups Official
Anton Chikin
Да, взял U-Net, который формирует многомерное потенциальное поле. Далее для каждого юнита рассчитывал вероятность действий на основании значения ПП в окрестности юнита. Далее реализовал алгоритм Policy Gradient
Круто, а почему именно U-Net?
источник

ДК

Дмитрий Каштанов... in AI Cups Official
Sergio Tulentsev
Например, что за ограничения?
Добавление крейтов в образ занимает от нескольких часов до пары дней. А в Rust в отличие от Python минимальная база. Я попросил добавить iterttools и мне повезло, что это заняло несколько часов. Потом я подумал про log и понял, что больше не готов столько времени терять. Использование своих образов позволит как снять ненужную нагрузку с организаторов, так и повысить зрелость решений, а также даст больше шансов новичкам, которые вместо своих наработок смогут взять компоненты не сильно хуже тех, что написаны под себя ветеранами
источник

AC

Anton Chikin in AI Cups Official
SilentNox
Круто, а почему именно U-Net?
Я подумал, что это проще, чем реализовать Pointer Net, как в AlphaStar. U-Net позволяет для каждой точки карты вернуть действие для юнита, который находится в этой точке. То есть сеть сразу возвращает действия для всех юнитов, независимо от того, сколько их у тебя
источник

DK

Dmitriy Krylov in AI Cups Official
А как ты учитывал кол-во оставшихся ресурсов или здоровье и т.д?
источник

AC

Anton Chikin in AI Cups Official
Dmitriy Krylov
А как ты учитывал кол-во оставшихся ресурсов или здоровье и т.д?
U-net на вход принимает карту из  N-слоев: 80x80xN.  Несколько слоев задают  тип юнита, другой слой - здоровье, третий слой - чей юнит и т.д кодируется вся информация
источник

DK

Dmitriy Krylov in AI Cups Official
А, понял
источник

S

SilentNox in AI Cups Official
Anton Chikin
U-net на вход принимает карту из  N-слоев: 80x80xN.  Несколько слоев задают  тип юнита, другой слой - здоровье, третий слой - чей юнит и т.д кодируется вся информация
Это все на питоне? Как долго сеть обучалась?
источник