Size: a a a

2020 May 12

M

Mi in Moscow Spark
учитвая что это временные файлы, то сильной проблемы я не вижу, также учитвая что у S3 грустно с move операцией которую спарк активно использует, то может быть даже быстрее
источник

M

Mi in Moscow Spark
Andrey Smirnov
мне казалось что distcp тоже создает временные файлы
точно создает, учитывая что это набор MR задач
источник

JF

Jane Frankenstein in Moscow Spark
@meosit, спасибо
источник

M

Mi in Moscow Spark
да не за что
источник
2020 May 13

G

Gev in Moscow Spark
Народ, подскажите
Я поднял на сервере в докере ванильный HADOOP в singlnode и туда на HDFS положил файлег
С сервера читаю его в в spark-shell без проблем
Пытаюсь с локальной машинки прочитать а мне выдается :
java.io.IOException: Could not read footer for file и полный путь к файлику
Порт и сервер, к которому коннекчусь - прокинуты и читаются но похоже какой то касяк с доступом или может я чтото не так прописал при попытке достучаться до файла
Может у кого то есьт опыт таких плясок с бубном
Ванильный HADOOP в докере на удаленном сервере
источник

PL

Pavel L in Moscow Spark
Всем привет! Был бы очень благодарен, если кто-то поделится успешным опытом использования Snowflake вместе со Spark-ом.

Есть некоторые Snowflake специфичные вопросы с которыми столкнулся и документация никак не помогает в них, а именно query queued time / execution time  - который неожиданно очень сильно растет если использовать SF из Спарка

Заранее спасибо!
источник

K

KrivdaTheTriewe in Moscow Spark
источник

GP

Grigory Pomadchin in Moscow Spark
очень плохо
источник

K

KrivdaTheTriewe in Moscow Spark
Grigory Pomadchin
очень плохо
я может в танке, а при каких ситуациях отрицательное число тасок
источник
2020 May 14

GP

Grigory Pomadchin in Moscow Spark
KrivdaTheTriewe
я может в танке, а при каких ситуациях отрицательное число тасок
когда ты не очень продуктивен
источник

PK

Pavel Klemenkov in Moscow Spark
источник

GP

Grigory Pomadchin in Moscow Spark
круто что они вкладываются в это
источник

GP

Grigory Pomadchin in Moscow Spark
может родится новый ‘спарк’ в итоге
источник

PK

Pavel Klemenkov in Moscow Spark
Grigory Pomadchin
может родится новый ‘спарк’ в итоге
Ну он, по факту, уже есть при чём, что радует, если оператор не реализован на gpu, то он не падает, а продолжает работать на CPU. В отличие от даска того же
источник

GP

Grigory Pomadchin in Moscow Spark
Pavel Klemenkov
Ну он, по факту, уже есть при чём, что радует, если оператор не реализован на gpu, то он не падает, а продолжает работать на CPU. В отличие от даска того же
очень хорошо; а будет все у опенсурсе?
источник

GP

Grigory Pomadchin in Moscow Spark
а удобоно использовать? стоит ли ждать нового распределенного фреймворка или пока все же он топ оф спарк планируют?
источник

R

Renarde in Moscow Spark
Pavel Klemenkov
Ну он, по факту, уже есть при чём, что радует, если оператор не реализован на gpu, то он не падает, а продолжает работать на CPU. В отличие от даска того же
А есть какие-нибудь бенчмарки вроде vanilla vs gpu? На TPC-H скажем
источник

PK

Pavel Klemenkov in Moscow Spark
Renarde
А есть какие-нибудь бенчмарки вроде vanilla vs gpu? На TPC-H скажем
Есть, но пока внутри
источник

PK

Pavel Klemenkov in Moscow Spark
Grigory Pomadchin
а удобоно использовать? стоит ли ждать нового распределенного фреймворка или пока все же он топ оф спарк планируют?
Как обычный спарк. Ну и с десяток опций как обычно )
источник

R

Renarde in Moscow Spark
Pavel Klemenkov
Есть, но пока внутри
да-да, я нашел (тоже внутри 😁)
источник