Телеграмм чат группы theoreticalrl страница 73

Ссори, пропустил.
Да не откуда в общем. В теории распр Коши возникает в том числе из практический соображений, то есть потенциально агенту встретиться может. А он, решая задачу регрессии решить ее не сможет без спец методов.

источник

22:14пожаловаться #6

2018 March 12

АП

Алексей Полиевиц... in RL reading group

а будет семинар в этот четверг (15-го марта)?

источник

22:31пожаловаться #7

cydoroga in RL reading group

Алексей Полиевиц

а будет семинар в этот четверг (15-го марта)?

Да, будет
Анонс будет чуть позже

источник

22:35пожаловаться #8

2018 March 13

Misha Yagudin in RL reading group

Слегка по касательной ~15 минут назад начался сбор вопросов на AMA about GANs w/ Ian Goodfellow, само AMA будет в четверг.

Upd: fermatslibrary.com/arxiv_comments?url=https%3A%2F%2Farxiv.org%2Fpdf%2F1406.2661.pdf
Upd2: 🤦‍♂️

источник

22:19пожаловаться #9

2018 March 14

cydoroga in RL reading group

Всем привет!
В этот четверг, как обычно, наш семинар пройдет в 19:00 в Стенфорде.

На семинаре выступлю я со статьей Learning and Querying Fast Generative Models for Reinforcement Learning
https://arxiv.org/pdf/1802.03006.pdf
Статью написали ребята из Deepmind

Мы разберемся, как создать хорошую модель динамики среды. То есть поговорим о model-based RL. И посмотрим, как авторы уделали model-free SoTA на MS_PACMAN.

Будет интересно, не забудьте зарегистрироваться по ссылке сегодня, если хотите прийти:
https://goo.gl/forms/n8ueMHhbv4nsIUm52

Google Docs

Deep RL reading group meeting

Если у Вас нет ШАДовского пропуска, и если Вы бы хотели посетить семинар, на котором разбираются статьи про RL, то эта форма – для Вас!

Несколько важных моментов:

1. Эту форму нужно будет заполнять КАЖДЫЙ РАЗ перед каждым семинаром, указывая дату предстоящего семинара

2. Отправлять форму нужно НЕ ПОЗЖЕ ВЕЧЕРА ДНЯ ПРЕДШЕСТВУЮЩЕГО СЕМИНАРУ (не позже среды, если семинар в чт). Если вдруг вы в день семинара поняли, что не успели отправить форму – пишите организаторам, что-нибудь придумаем!

3. В день семинара нужно ПРИХОДИТЬ С ПАСПОРТОМ. Без него могут не пустить.

источник

14:44пожаловаться #10

Anton Pechenko in RL reading group

Я, вероятно, не смогу быть и провести трансляцию, так как болею

источник

15:20пожаловаться #11

📒

📒 in RL reading group

жаль что не получилось со стримом, как раз вчера работал над model based, в любом случае спасибо за пейпер не слышал про него

источник

21:20пожаловаться #12

2018 March 15

cydoroga in RL reading group

Ребят, я похоже заболел, и вряд ли смогу очухаться до вечера(
Поэтому предлагаю все же сегодня доклад отменить

источник

06:41пожаловаться #13

2018 March 18

Aleksey Grinchuk in RL reading group

Ребят, кто-нибудь знает как мне в Питоне раскидать несколько процессов по CPU карточкам? Мне бы хотелось сделать штуку, которая в параллели несколько игр запускает и собирает данные в Reaply Buffer. Буду благодарен, если кто-то в этом шарит и может помочь или поделиться грамотным гайдом.

источник

16:24пожаловаться #14

Evgenii Nikishin in RL reading group

пакет multiprocessing — в нём создаёшь столько процессов, сколько хочешь одновременно выполняющихся сред

источник

16:35пожаловаться #15

Shmuma in RL reading group

В pytorch есть обертка вокруг muliprocessing. Я делал что-то примерно как ты описываешь для dqn. В меру грамотный гайд тут: “Speeding up DQN on PyTorch: how to solve Pong in 30 minutes” https://medium.com/mlreview/speeding-up-dqn-on-pytorch-solving-pong-in-30-minutes-81a1bd2dff55

Medium

Speeding up DQN on PyTorch: how to solve Pong in 30 minutes

In this article we take DQN on PyTorch and try to speed it up using Pong game as a benchmark. After several not very complicated steps, we’ll get more than 3 times speed up.

источник

16:37пожаловаться #16

Sergey Kolesnikov in RL reading group

@rl_agent вот тебе пример:
https://github.com/Scitator/Run-Skeleton-Run/blob/master/ddpg/train.py

GitHub

Scitator/Run-Skeleton-Run

Reason8.ai PyTorch solution for NIPS RL 2017 challenge - Scitator/Run-Skeleton-Run

источник

18:03пожаловаться #17

Sergey Kolesnikov in RL reading group

как мне кажется, там можно просто поменять среду на какую-нибудь continuous из gym и будет работать

источник

18:04пожаловаться #18

Anton Pechenko in RL reading group

#!/usr/bin/env python

import subprocess
import atexit
import time

ps = []

for i in range (24):
ps.append(subprocess.Popen(['python', 'agent.py', '--visualize']))

def on_exit():
for p in ps:
p.kill ()

atexit.register(on_exit)

while True:
time.sleep(60)

источник

18:07пожаловаться #19

2018 March 20

Anton Pechenko in RL reading group

Ребята, а дайте правильную ссылку на d4pg?

источник

12:06пожаловаться #20