Size: a a a

2020 July 15

t

tenKe in Moscow Spark
с кешом работает понятное дело
источник

M

Mi in Moscow Spark
не назвал бы это костылем
источник

GP

Grigory Pomadchin in Moscow Spark
tenKe
и я подозреваю, что это все проделки CollapseProject
а план какой
источник

t

tenKe in Moscow Spark
Grigory Pomadchin
а план какой
первые два с двумя селектами
источник

t

tenKe in Moscow Spark
а optimized logical - с одним
источник

t

tenKe in Moscow Spark
то есть это каталист
источник

t

tenKe in Moscow Spark
ну и физический разумеется тоже с 1 )
источник

t

tenKe in Moscow Spark
Mi
не назвал бы это костылем
ну это не костыль, если у тебя не стримы и кешей других нет
источник

t

tenKe in Moscow Spark
здесь я не хочу кеш делать только из-за того, что спарк объединяет проекции
источник

t

tenKe in Moscow Spark
Grigory Pomadchin
а ты то сетишь? там помоему те нужна org.apache.spark.sql.internal.SQLConf.WHOLESTAGE_CODEGEN_ENABLED
я имел ввиду через spark.sql.optimizer.excludedRules CollapseProject
источник

t

tenKe in Moscow Spark
с выключенным wholeStageGenом работает правильно даже без выключения CollapseProject
источник

GP

Grigory Pomadchin in Moscow Spark
tenKe
с выключенным wholeStageGenом работает правильно даже без выключения CollapseProject
круто
источник
2020 July 16

AG

Alex Gorodnitskiy in Moscow Spark
Привет, может кто сталкивался с такой проблемой: в обычном режиме ресурсы аллоцируются по требованию и после выполенения скрипта освобождаются, но при использовании broadcast и последующего выполнения broadcastObject.unpersist() в конце скрипта, спарк все равно оставляет на себе все ресурсы запрошенные во время исполнения скрипта, даже если ничего не выполняет, на данный момент решаю эту проблему закрытием спарк контекста и открытием его снова. Динамическая аллокация включена, версия спарка 2.4.0. Подскажите, пожалуйста, сталкивался ли кто-нибудь с такой проблемой и как ее можно решить, а то ресурсами на кластере не разживешься😔
источник

Ik

Ilia ksen in Moscow Spark
Alex Gorodnitskiy
Привет, может кто сталкивался с такой проблемой: в обычном режиме ресурсы аллоцируются по требованию и после выполенения скрипта освобождаются, но при использовании broadcast и последующего выполнения broadcastObject.unpersist() в конце скрипта, спарк все равно оставляет на себе все ресурсы запрошенные во время исполнения скрипта, даже если ничего не выполняет, на данный момент решаю эту проблему закрытием спарк контекста и открытием его снова. Динамическая аллокация включена, версия спарка 2.4.0. Подскажите, пожалуйста, сталкивался ли кто-нибудь с такой проблемой и как ее можно решить, а то ресурсами на кластере не разживешься😔
советую задать вопрос в другом паблике
источник

PK

Pavel Klemenkov in Moscow Spark
В каком?
источник

Ik

Ilia ksen in Moscow Spark
источник

Ik

Ilia ksen in Moscow Spark
вот тут возможно смогут ответить на ваш вопрос
источник

AG

Alex Gorodnitskiy in Moscow Spark
Ilia ksen
вот тут возможно смогут ответить на ваш вопрос
Спасибо
источник

Ik

Ilia ksen in Moscow Spark
Alex Gorodnitskiy
Спасибо
да не за что)
источник

GP

Grigory Pomadchin in Moscow Spark
Pavel Klemenkov
В каком?
мне нравится что у нас везде одни и теже рожи)
источник