Ребята, помогите разобраться. В статье про Imagination в RL (
https://arxiv.org/pdf/1707.06203.pdf) пишут что при обучении Environment Model использовалась Bernoulli cross-entropy loss (стр 14, пункт B.2). Но на выходе у Environment Model пиксели, того же размера что и на входе. Как можно пиксели сравнивать через cross-entropy я что-то никак не вкурю. Сделал там MSE, вроде работает, но все равно червячок сомнения не дает спать спокойно. Может я туплю, и надо по другому учить?