Size: a a a

RL reading group

2017 November 23

AP

Anton Pechenko in RL reading group
там еще меньше вероятность прочтения, мне кажется
источник

AP

Anton Pechenko in RL reading group
@ipaulo там N зафиксировано, и мне кажется оно не больше 10
источник

AP

Anton Pechenko in RL reading group
мне кажется)
источник

SK

Sergey Kolesnikov in RL reading group
и да, наибольшая вероятность, что все решалось для заданного количества агентов
источник

P

Pavel Shvechikov in RL reading group
Anton Pechenko
@ipaulo там N зафиксировано, и мне кажется оно не больше 10
Ссорян, будем читать
источник

P

Pavel Shvechikov in RL reading group
nznxkxbpvp
источник

AP

Anton Pechenko in RL reading group
но  в таком подходе получается нет именно стратежности
источник

AP

Anton Pechenko in RL reading group
то есть это позволяет реализовывать тактические приемы
источник

AP

Anton Pechenko in RL reading group
но не позволяет реализовать какие-то длинные стратегии для всех юнитов + строительство, экномика
источник

AP

Anton Pechenko in RL reading group
но игра то стратегическая
источник

AP

Anton Pechenko in RL reading group
надо время из интернета выгрузить
источник

AP

Anton Pechenko in RL reading group
он просто выключился из-за того, что сел
источник

AP

Anton Pechenko in RL reading group
типа учимся на семплах которые примерно по силе близки к текущему агенту
источник

AP

Anton Pechenko in RL reading group
видимо такой трюк для более бстрого обучения
источник

AP

Anton Pechenko in RL reading group
ну то есть он учится играть из играбельных ситуаций а не откровенно проигрышных или выигрышных
источник

AP

Anton Pechenko in RL reading group
всегда лучше учится играть против примерно равного противника, а не против гроссмейстера, когда ты не умеешь
источник

P

Pavel Shvechikov in RL reading group
Anton Pechenko
ну то есть он учится играть из играбельных ситуаций а не откровенно проигрышных или выигрышных
Вопрос был в том, что если останавливаться по своей оценке и  обучать на этом же свою оценку, то возникает положительная обратная связь, которая до добра не может довести.
Aleksey расскажет почему это работает на след неделе. (спойлер - порог настраивается исходя из честно доигранных позиций, предварительно оцененных, как проигрышные)
источник

AP

Anton Pechenko in RL reading group
я думал, что вопрос был зачем вообще останавливаться?
источник

AP

Anton Pechenko in RL reading group
я немного прослушал, а что по старкрафту планируется какое-то соревнование?
источник

P

Pavel Shvechikov in RL reading group
Anton Pechenko
я немного прослушал, а что по старкрафту планируется какое-то соревнование?
Ничего об этом не знаю. Вроде @Fritx говорил, что какое-то ежегодное сооревнование по киберспорту будет весной (летом?)
источник