очень интересно. я не верил, что RL подход заработает в шахматах, т.к. существующие программы уже очень сильны. однако им удалось победить Stockfish и еще при этом тратить меньше времени на ход
очень интересно. я не верил, что RL подход заработает в шахматах, т.к. существующие программы уже очень сильны. однако им удалось победить Stockfish и еще при этом тратить меньше времени на ход
ну по флопсам думаю больше вышло, но победа над stockfish впечатляет
во время обучения она некоторые начала вообще перестала играть, судя по графику, и все чаще выбирать ферзевой гамбит и английское начало (если я правильно проинтерпретировал график)
во время обучения она некоторые начала вообще перестала играть, судя по графику, и все чаще выбирать ферзевой гамбит и английское начало (если я правильно проинтерпретировал график)
люди сидели, годами писали движок, тут пришел дип майнд и через несколько часов движок побит) конечно нужно к чему-то придраться, но это все такое себе