Size: a a a

2021 January 25

EC

Eugene Chipizubov in Moscow Spark
1min
источник

EC

Eugene Chipizubov in Moscow Spark
источник

EC

Eugene Chipizubov in Moscow Spark
ничего криминального
источник

EC

Eugene Chipizubov in Moscow Spark
ну или я не вижу
источник

GP

Grigory Pomadchin in Moscow Spark
Eugene Chipizubov
ничего криминального
А покажи целиком что ренджпаримштринг делает
источник

EC

Eugene Chipizubov in Moscow Spark
5сек, никак не выйдет из шторма
источник

EC

Eugene Chipizubov in Moscow Spark
источник

GP

Grigory Pomadchin in Moscow Spark
А ты не можешь план целиком что б все стейджи расписанные было видно?)
источник

GP

Grigory Pomadchin in Moscow Spark
Там наверняка написано будет где и почему делается большой репартишн
источник

EC

Eugene Chipizubov in Moscow Spark
Grigory Pomadchin
Там наверняка написано будет где и почему делается большой репартишн
Job -> Stage ?
источник

EC

Eugene Chipizubov in Moscow Spark
источник

EC

Eugene Chipizubov in Moscow Spark
3.2 GB / 17638
источник

EC

Eugene Chipizubov in Moscow Spark
input size | records
источник

EC

Eugene Chipizubov in Moscow Spark
7.9 GB / 43207
источник

EC

Eugene Chipizubov in Moscow Spark
пока влезает в один executor
источник

EC

Eugene Chipizubov in Moscow Spark
все умер по хипу
источник

EC

Eugene Chipizubov in Moscow Spark
Разобрался предварительно, похоже нельзя использовать coalesce с orderBy
источник

EC

Eugene Chipizubov in Moscow Spark
Во первых предельно coalesce не может выдать больше дефолтного spark.sql.shufle.partitions
источник

EC

Eugene Chipizubov in Moscow Spark
Во вторых может генерить эпическое число tasks
источник

t

tenKe in Moscow Spark
coalesce лучше вообще не юзать без явной необходимости
источник