Расстояние Вассерштейна проще всего интерпретировать в дискретном случае: совместное распределение записывается матрицей, а маргинальные распределения – это построчные / постолбцовые суммы. Тогда в ячейке p_ij указывается, какую долю массы мы переносим из i в j, цена такого переноса измеряется расстоянием между i и j
Ещё я не согласен с тем, что там чисто импорты, так как парень неплохо разбирается в теории вероятности, статистике и других вещах, не самых простых для девятиклассника.
Паренёк из OpenAI, конечно, крут, с этим я не спорю. И блог у него интересный.