Size: a a a

2021 February 12

ПФ

Паша Финкельштейн... in Moscow Spark
Причём на них можно выполнить дистинкт и тогда, если повезёт, джойн выполнится броадкастом
источник

ИК

Иван Калининский... in Moscow Spark
Gev
Так вопрос в том что днные паркета джойнятся со справочником. И вот в результате джойна не понятно - есть данные или нет. Так в результате придется сохранять
Паша дело говорит!
источник

ПФ

Паша Финкельштейн... in Moscow Spark
*не забыть закешировать данные до джойна
источник

ПФ

Паша Финкельштейн... in Moscow Spark
** на дистинкте поди будет шафл, хз стоит ли оно того
источник

NN

No Name in Moscow Spark
Паша Финкельштейн
** на дистинкте поди будет шафл, хз стоит ли оно того
Будет, как пить дать
источник

NN

No Name in Moscow Spark
Иван Калининский
Не делать так. Во всех случаях работало дольше или фейлилось. Персист только для небольших сложных планов с многократным использованием или, как мне недавно подсказал Григорий, если используются DF.checkpoint
А можно поподробнее про чекпоинт?
источник

ИК

Иван Калининский... in Moscow Spark
No Name
А можно поподробнее про чекпоинт?
можно, но вообще тут уже была дискуссия, щас поищу
источник

ИК

Иван Калининский... in Moscow Spark
вот начало, в инженерском чате
источник

ИК

Иван Калининский... in Moscow Spark
Переслано от Иван Калининский...
@pomadchin, раз уж пошло обсуждение, то в описании локальных чекпоинтов указывается executor storage. Что означает этот термин?

Механизм чекпоинтов нежный, но рекавериться можно после кила и рестора кластера. Как это сочетается одно с другим, или я не уловил сарказма?
источник

ИК

Иван Калининский... in Moscow Spark
я думал, будет ссылка на оригинальное сообщение, ну можно поиском найти))
источник

ПФ

Паша Финкельштейн... in Moscow Spark
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Фиг ли
источник

NN

No Name in Moscow Spark
Спасибо, друзья
источник

ИК

Иван Калининский... in Moscow Spark
F F F [^_^]
источник

G

Gev in Moscow Spark
Ну в общем я об этом и говорил. Придется считать кунты на логике.
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Народ, а есть способ сделать count по оконной функции?
источник

ПФ

Паша Финкельштейн... in Moscow Spark
То есть формально я понимаю что надо писать count.over
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Но как ей сказать что мне надо сделать count того, что у меня в данной строке и что искать это надо по окну?
источник

А

Алексей in Moscow Spark
Паша Финкельштейн
Народ, а есть способ сделать count по оконной функции?
sum(count(*)) over(...) ?
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Алексей
sum(count(*)) over(...) ?
А, блин, я понял что забыл синтаксис и на самаом деле мне, пооду надо нечто более сложное
источник