Size: a a a

RL reading group

2018 January 12

EZ

Evgenii Zheltonozhsk... in RL reading group
украсть ящик водки, продать, а деньги пропить
источник

SO

Sergey Ovcharenko in RL reading group
А А3С разве не всегда на CPU быстрее работал?
источник

SO

Sergey Ovcharenko in RL reading group
И в частном разговоре господа из OpenAI говорили, что они pong за 7 минут решают :-)
источник

SK

Sergey Korolev in RL reading group
Sergey Ovcharenko
А А3С разве не всегда на CPU быстрее работал?
у меня на этот счёт противоречивые воспоминания
источник

AP

Alexander Pashevich in RL reading group
Sergey Ovcharenko
А А3С разве не всегда на CPU быстрее работал?
Всегда, но там боттлнэк на количество спю используемых. На 800 спю не проскейлится, но с другой стороны это вроде и не особо требуется)
источник
2018 January 13

NK

ID:404922778 in RL reading group
Hello
источник

NK

ID:404922778 in RL reading group
only with google translation ,i can know what you are saying😂
источник

G

G in RL reading group
Same here
источник

NK

ID:404922778 in RL reading group
from china
источник

G

G in RL reading group
From India
источник

AP

Anton Pechenko in RL reading group
Do translations looks reasonable?
источник

NK

ID:404922778 in RL reading group
ñice
источник
2018 January 14

AP

Alexander Pashevich in RL reading group
does yandex translation work better with the ru-eng pair? :)
источник

AP

Alexander Pashevich in RL reading group
does yandex use NNs for the translation? :)
источник

JH

Just Heuristic in RL reading group
источник

AP

Alexander Pashevich in RL reading group
Thank you ;)
источник
2018 January 15

P

Pavel Shvechikov in RL reading group
[1801.03326] Expected Policy Gradients for Reinforcement Learning
https://arxiv.org/abs/1801.03326
источник

P

Pavel Shvechikov in RL reading group
[1801.01290] Soft Actor-Critic: Off-Policy Maximum Entropy Deep Reinforcement Learning with a Stochastic Actor
https://arxiv.org/abs/1801.01290
источник

R

Radoslav in RL reading group
Товарищи, а кто имеет опыт внедрения TF нейронок куда-либо?
Столкнулся с проблемой, что сеть, натренированная на GPU (GTX 1080) в режиме evaluation'а на CPU работет невероятно медленно.
источник

R

Radoslav in RL reading group
Может быть, я что-то не так делаю?
источник