Size: a a a

2021 January 21

GP

Grigory Pomadchin in Moscow Spark
да и если можно использовать спарк скуль не ясно зачем хайв тащить тогда
источник

e

er@essbase.ru in Moscow Spark
Mi
А что странного то?
Утверждается что клиент работает лучше чем ядро. Наверное очепятка
источник

M

Mi in Moscow Spark
er@essbase.ru
Утверждается что клиент работает лучше чем ядро. Наверное очепятка
Под ядром имеется в виду хайв что ли?
источник

M

Mi in Moscow Spark
Нифига не понял
источник

M

Mi in Moscow Spark
Grigory Pomadchin
да и если можно использовать спарк скуль не ясно зачем хайв тащить тогда
А мне хайв скуль больше нравится, его можно и с православным мапредьюсом юзать
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Вопрос: почему spark sql может быть в десятки раз быстрее аналогичного запроса на df? Точнее на датасетах
источник

DZ

Dmitry Zuev in Moscow Spark
Паша Финкельштейн
Вопрос: почему spark sql может быть в десятки раз быстрее аналогичного запроса на df? Точнее на датасетах
Планы то где различаются?
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Не успел посмотреть, слишком быстро обрабатывается sql. Завтра посмотрю
источник

GP

Grigory Pomadchin in Moscow Spark
Паша Финкельштейн
Не успел посмотреть, слишком быстро обрабатывается sql. Завтра посмотрю
интересное предложение)
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Ну блин, а что мне сказать. Сделаю чтобы история была и посмотрю в ней
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Но мне интересно теоретически, конечно
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Как понять что такое будет. Там простая агрегация на буквально пару сотен тысяч строк
источник

e

er@essbase.ru in Moscow Spark
Паша Финкельштейн
Но мне интересно теоретически, конечно
ds принудительно распихивать данные по нодам ?
sql включает умного и делает все на одной ?
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Всё синглнод
источник

K

KrivdaTheTriewe in Moscow Spark
план запроса нужно в обоих слуаех глянуть, там и будет ответ
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Так, зашёл в план выполнения запроса, понял что запрос с DS не просто в десятки раз долдбше выполняется, он просто не работает
источник

ПФ

Паша Финкельштейн... in Moscow Spark
В смысле бесконечно висит
источник

С

Сюткин in Moscow Spark
А из-за чего если не секрет?
источник

ПФ

Паша Финкельштейн... in Moscow Spark
То есть csv просто не читается
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Да я вот не понимаю даже как дебажить
источник