Я ж сюда со своей проблемой писал на прошлой неделе, окно/джоин по большой грязной патриции -> репартишен -> начинает спилить на диск -> через какое-то время Ярн убивает контейнер по памяти.
--
Вполне возможно что это может быть проблема вообще ярна или какой-то не совсем идеальной конфигурации экщекуторов когда вот чуть чуть не хватает, но тем не менее
Ну, прикол в том, что есть некий набор достаточно стандартных действий, которые обычно помогают решить такого рода проблему, как ООМ. Поэтому на глубинном уровне, мне кажется, многие не заморачиваться по этому поводу. Я вот периодически по тому или иному поводу начинаю это делать, и, спасибо
@tenKe , в этот раз ещё часть алгоритмов работы спарка в голове уложились во что-то более-менее стройное. Но при этом я тоже перестал понимать, в какой же все таки момент спилл не спасает от ООМ. Гипотетически, наверное, у нас есть объем доступной памяти для коров, и если объема памяти на одну корову недостаточно для того, чтобы обработать хотя бы 1 партицию, он не может в такой ситуации спиллить и просит умирает, типа меньше минимальной единицы параллелизма низя. Но гипотеза выглядит говном, т.к. тогда вообще не оч понятно, в каком случае тогда спилл появляется, да и с чего бы ему вдруг не уметь обрабатывать партицию в несколько этапов?