Телеграмм чат группы theoreticalrl страница 107

А какие есть игры двух игроков с небольшим, но интересным скрытым состоянием? Хороший пример — покер, где скрытое состояние — карты противника. Не очень хороший пример — итеративная дилемма заключённого, скрытое состояение — стратегия оппонента (не очень). Ещё в голову приходят слепые крестики-нолики. Ещё есть игры с «туманом войны».

источник

16:10пожаловаться #4

Aynur Maksutov in RL reading group

Морской бой?

источник

16:37пожаловаться #5

Misha Yagudin in RL reading group

Спасибо! Кажется, что морской бой это на самом деле две игры: придумать расстановку и придумать аттаку.

источник

16:54пожаловаться #6

2018 September 09

Nikolay Bazenkov in RL reading group

Очко (блэк джек)? Мне кажется, что в морском бое есть оптимальная расстановка: крупные по краям, а одноклеточные в центре случайным образом.

источник

15:43пожаловаться #7

Misha Yagudin in RL reading group

Спасибо, Николай.

источник

16:49пожаловаться #8

Dmitry Mittov in RL reading group

Nikolay Bazenkov

вроде если один в центре. обоснование: максимизируем мат ожидание попадания в корабль при условии, что противник знает стратегию.

источник

18:11пожаловаться #9

Aleksandr Mikhailov ... in RL reading group

Nikolay Bazenkov

Оптимальная расстановка должна быть какой-то рандомизированной, наверное

источник

18:19пожаловаться #10

Nikolay Bazenkov in RL reading group

Dmitry Mittov

Да, наверное, один в центре (случайное поле). Должно остаться максимальное число пустых клеток, если убить все другие корабли.

источник

18:33пожаловаться #11

Dmitry Mittov in RL reading group

Aleksandr Mikhailov 😷

Оптимальная расстановка должна быть какой-то рандомизированной, наверное

по сравнению с совсем рандомизированной один корабль в центре увеличивает мат ожидание выстрелов противника, если он знает твою стратегию. не считал, но где-то прочел и поверил наслово.

но возможно есть стратегия лучше, что противник ее знает и все равно expectation еще выше. скорее всего нет, я верю, что один корабль - оптимальная, но доказательств я не видел.

источник

18:36пожаловаться #12

Dmitry Mittov in RL reading group

с одним кораблем есть еще cheat trick, когда ты его просто не ставишь и делаешь вид, что противник промахивается ))

источник

18:36пожаловаться #13

Alexander Pukhov in RL reading group

Если для одного корабля в центре в среднем требуется n / 2 выстрелов, где n — число центральных полей, то для двух / трех / четрых уже матожидание максимума (как я понимаю), то есть 2n/3, 3n/4, 4n/5.

Кажется, что это явно окупает те несколько дополнительных выстрелов на краю, так что один корабль — явно не оптимальная стратегия.

источник

18:44пожаловаться #14

Alexander Pukhov in RL reading group

К сожалению, они там не независимы (в том плане, что вместе с кораблем умирает и окрестность, так что матожидание максимума неправильный ответ, например), так что честно оценить все сложно, и возможно большие стоит "детерминировано" ставить на край, чтобы уменьшить их окрестности. Но в любом случае стратегия должна выглядеть как распределение на всех возможных расстановках, скорее всего не равномерное.

источник

18:47пожаловаться #15

2018 September 13

Sergey Kolesnikov in RL reading group

очень топовый обзор на max entropy rl by Levine:
https://arxiv.org/abs/1805.00909
байесовский катарсис, да и вообще тема огонь
PS. надо бы обновить papers за полгода

источник

17:06пожаловаться #16

Artem Ryzhikov in RL reading group

🔥

источник

17:57пожаловаться #17

2018 September 14

Artem Ryzhikov in RL reading group

Вкладка papers to discuss же? Я правильно понял, что всего два человека докладывались оттуда?

источник

11:35пожаловаться #18

Artem Ryzhikov in RL reading group