Привет!
Как посчитать операт. память для spark приложения?
Например, есть две таблицы, 1 - весит 20 Гб , а 2 - 3 ГБ, выполняется left join . (оч тривиальный кейс)
Количество ядер и экзек можно взять минимальные (1 - exec, 1-core), распределение exec memory оставляем дефолтные (75 на 25 % ), броадкаст оставляем на каталист.
До этого момента выбирал эмпирическим методом оперативку для своего приложения (если падает с oom выделяю больше), а также под рукой нет графаны.