Телеграмм чат группы theoreticalrl страница 44

очень интересно. я не верил, что RL подход заработает в шахматах, т.к. существующие программы уже очень сильны. однако им удалось победить Stockfish и еще при этом тратить меньше времени на ход

источник

21:25пожаловаться #5

EZ

Evgenii Zheltonozhsk... in RL reading group

Aleksandr Mikhailov 😷

очень интересно. я не верил, что RL подход заработает в шахматах, т.к. существующие программы уже очень сильны. однако им удалось победить Stockfish и еще при этом тратить меньше времени на ход

ну по флопсам думаю больше вышло, но победа над stockfish впечатляет

источник

21:33пожаловаться #6

EZ

Evgenii Zheltonozhsk... in RL reading group

Еще бы книгу и эндшпильные таблицы

источник

21:33пожаловаться #7

AN

Alexander Novikov in RL reading group

Думаю по флопсам ровно столько же вышло, там лимит по времени думания и оба подхода отлично параллелятся)

источник

21:42пожаловаться #8

EE

Evgenii Egorov in RL reading group

А кто-нибудь смотрел сами партии? Там получилось что-то не ожиданное?

источник

21:43пожаловаться #9

EK

Evgeny Kovalev in RL reading group

(вот ссылка, если что)
https://lichess.org/study/EOddRjJ8

lichess.org

Alphazero vs Stockfish

A chess study by Spreek

источник

21:49пожаловаться #10

AM

Aleksandr Mikhailov ... in RL reading group

во время обучения она некоторые начала вообще перестала играть, судя по графику, и все чаще выбирать ферзевой гамбит и английское начало (если я правильно проинтерпретировал график)

источник

21:49пожаловаться #11

EZ

Evgenii Zheltonozhsk... in RL reading group

Alexander Novikov

Думаю по флопсам ровно столько же вышло, там лимит по времени думания и оба подхода отлично параллелятся)

да нифига, там же несколько tpu

источник

21:55пожаловаться #12

EE

Evgenii Egorov in RL reading group

Aleksandr Mikhailov 😷

во время обучения она некоторые начала вообще перестала играть, судя по графику, и все чаще выбирать ферзевой гамбит и английское начало (если я правильно проинтерпретировал график)

Понятно. Типичный закрытый :)

источник

21:55пожаловаться #13

AM

Aleksandr Mikhailov ... in RL reading group

Evgenii Egorov

Понятно. Типичный закрытый :)

ну мб это самые сложные для AlphaZero оказались

источник

21:56пожаловаться #14

EZ

Evgenii Zheltonozhsk... in RL reading group

ну вообще движковые профи сделали пару серьезных замечаний по методике

источник

21:59пожаловаться #15

AM

Aleksandr Mikhailov ... in RL reading group

Evgenii Zheltonozhskii🇮🇱

ну вообще движковые профи сделали пару серьезных замечаний по методике

на форуме lichess читаешь?

источник

22:01пожаловаться #16

EZ

Evgenii Zheltonozhsk... in RL reading group

Aleksandr Mikhailov 😷

на форуме lichess читаешь?

talkchess

источник

22:01пожаловаться #17

AN

Alexander Novikov in RL reading group

Ок, point taken, они наверное чужие движки на TPU не переписывали.

источник

22:01пожаловаться #18

EZ

Evgenii Zheltonozhsk... in RL reading group

Alexander Novikov

Ок, point taken, они наверное чужие движки на TPU не переписывали.

альфабета больше приспособлена для cpu

источник

22:02пожаловаться #19

AM

Aleksandr Mikhailov ... in RL reading group

люди сидели, годами писали движок, тут пришел дип майнд и через несколько часов движок побит) конечно нужно к чему-то придраться, но это все такое себе

источник

22:03пожаловаться #20