Телеграмм чат группы theoreticalrl страница 58

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

RL reading group

1092 membersпожаловаться на группу

1
«
…
‹
53
54
55
56
57
58
59
›
…
»

2018 January 24

EG

Evgeniy Golikov in RL reading group

Так это ж POMDP. Мы не знаем, что замышляют противиники, то есть, не знаем их стейт

источник

22:12пожаловаться #1

AG

Artem Grachev in RL reading group

да, мне тоже кажется, что это всё примеры POMDP

источник

22:12пожаловаться #2

AG

Artem Grachev in RL reading group

надо чтобы стейт противника был известен в момент принятия решения

источник

22:13пожаловаться #3

AG

Artem Grachev in RL reading group

Ну про MDP уже сказали, что там всегда есть детерминированная оптимальная policy

источник

22:13пожаловаться #4

P

Pavel Shvechikov in RL reading group

Например когда мы играем против противника, который адаптируется к нашему поведению, то о нем известно что он определит и отконтрит нашу политику, при этом знания о нем будут даны, это же тогда mdp?

Если противник известен, можно ли считать его частью среды?

источник

22:13пожаловаться #5

AP

Anton Pechenko in RL reading group

Да, я это и имею в виду, что например известен алгоритм его функционирования, например он всегда запоминает куда мы в последний раз побежали и пытается там нас поймать

источник

22:20пожаловаться #6

AP

Anton Pechenko in RL reading group

Тогда нам надо бежать каждый раз по новому

источник

22:20пожаловаться #7

AP

Anton Pechenko in RL reading group

То есть это не полноценный агент, а какой-то очень простой и мы знаем как он работает

источник

22:21пожаловаться #8

AG

Artem Grachev in RL reading group

а это разве MDP? ну то есть здесь получается, что наше состояние зависит не только от предыдущего, разве нет?

источник

22:21пожаловаться #9

EG

Evgeniy Golikov in RL reading group

Ну, можно свести к MDP, если "состоянием" считать историю состояний

источник

22:22пожаловаться #10

AG

Artem Grachev in RL reading group

ну для таких "состояний" и стратегия будет детерминированная в том плане, что мы будем выбирать новое место

источник

22:23пожаловаться #11

AG

Artem Grachev in RL reading group

Ну точнее это как раз тот случай, когда наша стохастическая — это смесь детерминированных

источник

22:23пожаловаться #12

AG

Artem Grachev in RL reading group

и по сути может быть детерминированной

источник

22:23пожаловаться #13

AP

Anton Pechenko in RL reading group

Ну а если нам известно о противнике что он всегда определит нашу детерминированность и использует это в свою пользу?

источник

22:25пожаловаться #14

AP

Anton Pechenko in RL reading group

Тогда это pomdp?

источник

22:25пожаловаться #15

AP

Anton Pechenko in RL reading group

Или тогда это mdp, когда вся история - это наш стейт?

источник

22:26пожаловаться #16

AG

Artem Grachev in RL reading group

Ну а если нам известно о противнике что он всегда определит нашу детерминированность и использует это в свою пользу?

мы близки к парадоксу

источник

22:27пожаловаться #17

AG

Artem Grachev in RL reading group

потому что с одной стороны мы знаем что думает противник и всегда можем пойти туда куда он не думает, что мы пойдем

источник

22:28пожаловаться #18

AG

Artem Grachev in RL reading group

с другой стороны противник всегда может угадать куда мы пойдем

источник

22:28пожаловаться #19

AG

Artem Grachev in RL reading group

что-то не сходится)

источник

22:28пожаловаться #20

1
«
…
‹
53
54
55
56
57
58
59
›
…
»