Ребят, у меня вопрос по Prioritized Experience Replay. В статье используют elaborate data structures, как, например, sum-tree. Если у меня есть массив (indices) индексов транзиций (s,a,r,s’) и массив с соответствующими вероятностями (prio) сэмплинга (пропорционально приоритетам), я же могу просто сделать np.random.choice(indices, batch_size, prio)?