Size: a a a

RL reading group

2019 April 20

EZ

Evgenii Zheltonozhsk... in RL reading group
Так на реддите пишут по крайней мере
источник

KO

Konstantin Ostrovsky in RL reading group
Кажется там проблема с exploration, как всегда. Еще было бы полезно использовать реплеи проф команд при обучении. Хотя бы варды научились бы ставить.
источник

EZ

Evgenii Zheltonozhsk... in RL reading group
Konstantin Ostrovsky
Кажется там проблема с exploration, как всегда. Еще было бы полезно использовать реплеи проф команд при обучении. Хотя бы варды научились бы ставить.
их слишком мало этих реплеев
источник

KO

Konstantin Ostrovsky in RL reading group
Evgenii Zheltonozhskii🇮🇱
их слишком мало этих реплеев
Зато инфы в них по каким-то аспектам больше, чем в 100500 игр модели с собой. Но это впрочем проблема всего современного ИИ. Неспособность эффективно использовать информацию.
источник

SK

Sergey Kolesnikov in RL reading group
Konstantin Ostrovsky
Кажется там проблема с exploration, как всегда. Еще было бы полезно использовать реплеи проф команд при обучении. Хотя бы варды научились бы ставить.
что-то мне подсказывает, что все эти реплеи еще будут использованы
источник

A

Alexander O in RL reading group
Тот последний бой OpenAI с победителями прошлого TI 2018 был, это был уже бой полностью по турнирными правилам или еще были какие-то ограничения на пул героев / предметов и т.д.?
источник

SA

See All in RL reading group
Alexander O
Тот последний бой OpenAI с победителями прошлого TI 2018 был, это был уже бой полностью по турнирными правилам или еще были какие-то ограничения на пул героев / предметов и т.д.?
С ограничениями
источник

EZ

Evgenii Zheltonozhsk... in RL reading group
Konstantin Ostrovsky
Зато инфы в них по каким-то аспектам больше, чем в 100500 игр модели с собой. Но это впрочем проблема всего современного ИИ. Неспособность эффективно использовать информацию.
Хз в людских играх много bias
источник

A

Alexander O in RL reading group
Тогда да, походу уже собирают реплеи от людей, чтобы не облажаться на финальном матче с кожаными мешками.
источник

EZ

Evgenii Zheltonozhsk... in RL reading group
Alexander O
Тогда да, походу уже собирают реплеи от людей, чтобы не облажаться на финальном матче с кожаными мешками.
Сказали что больше ничего не будет
источник

A

Alexander O in RL reading group
По требованиям трудящихся могут и выпустить отдельной командой в TI 2019.
источник

EZ

Evgenii Zheltonozhsk... in RL reading group
Alexander O
По требованиям трудящихся могут и выпустить отдельной командой в TI 2019.
evgeniyzh   [1 hour ago]
Сказали что больше соревнований не будет: https://www.reddit.com/r/DotA2/comments/bf49yk/hello_were_the_dev_team_behind_openai_five_we/elatx5h
и полного пула тоже не будет
https://www.reddit.com/r/DotA2/comments/bf49yk/hello_were_the_dev_team_behind_openai_five_we/elattjg
источник

KO

Konstantin Ostrovsky in RL reading group
Alexander O
Тогда да, походу уже собирают реплеи от людей, чтобы не облажаться на финальном матче с кожаными мешками.
Текущий подход так не работает, насколько я понимаю. Надо что-то новое придумывать, а у них, видимо, другие приоритеты
источник

П

Пётр in RL reading group
У них была задача сделать ИИ, который победит человека в более-менее похожих условиях. Они её достигли и поняли, что дальше таким подходом можно всё расширять и расширять.
У них не было цели сделать самого крутого бота Dota 2 со всеми возможностями.

Сейчас они на полученных результатах хотят сфокусироваться на других проблемах. В частности, говорили о том, как учить RL быстро и дёшево, а не за 800петафлопс-дней.
источник

П

Пётр in RL reading group
Эксперимент ставят, чтобы понять, как бороться с абузами.
источник

EZ

Evgenii Zheltonozhsk... in RL reading group
Пётр
У них была задача сделать ИИ, который победит человека в более-менее похожих условиях. Они её достигли и поняли, что дальше таким подходом можно всё расширять и расширять.
У них не было цели сделать самого крутого бота Dota 2 со всеми возможностями.

Сейчас они на полученных результатах хотят сфокусироваться на других проблемах. В частности, говорили о том, как учить RL быстро и дёшево, а не за 800петафлопс-дней.
+
источник

KO

Konstantin Ostrovsky in RL reading group
Пётр
У них была задача сделать ИИ, который победит человека в более-менее похожих условиях. Они её достигли и поняли, что дальше таким подходом можно всё расширять и расширять.
У них не было цели сделать самого крутого бота Dota 2 со всеми возможностями.

Сейчас они на полученных результатах хотят сфокусироваться на других проблемах. В частности, говорили о том, как учить RL быстро и дёшево, а не за 800петафлопс-дней.
Пускай тогда заопенсорсят ботов и кто-то другой продолжит это развивать. иначе в чем смысл:)
источник

EZ

Evgenii Zheltonozhsk... in RL reading group
Konstantin Ostrovsky
Пускай тогда заопенсорсят ботов и кто-то другой продолжит это развивать. иначе в чем смысл:)
смысл очевидно в рисерче рл техник а не в боте для игрушки)
источник

C

Constantine in RL reading group
Evgenii Zheltonozhskii🇮🇱
смысл очевидно в рисерче рл техник а не в боте для игрушки)
PR им тоже очень важен
источник

KO

Konstantin Ostrovsky in RL reading group
Evgenii Zheltonozhskii🇮🇱
смысл очевидно в рисерче рл техник а не в боте для игрушки)
Однако в игре такие боты неплохо бы смотрелись. Надо только настроить их на взаимодействие с игроками-людьми. Да и в научном плане, мне кажется, это очень крутая полезная задача, учить агента взаимодействию с человеком.
источник