Size: a a a

2021 July 08

DZ

Dmitry Zuev in Moscow Spark
Да, я не могу себе объяснить зачем
источник

V

Vitaly in Moscow Spark
Привет. Может кто встречался с проблемой: внутри spark driver библиотекой  hdfs (через outputStream) пишется файл и когда он достигает ровно 128 мб соединение закрывается и запись продолжает висеть. Ошибки не бросаются.
источник

V

Vitaly in Moscow Spark
Могут быть настройки сервера или ещё что?
источник

ПБ

Повелитель Бури... in Moscow Spark
Добрый день! Коллеги скажите пожалуйста , когда пишите  where к полю с типом BINARY  к строке кастуете?

TypeError: condition should be string or Column

это влияет на перфоманс? спасибо
источник

A

Alex in Moscow Spark
второй блок не аллоцируется?
источник

V

Vitaly in Moscow Spark
Похоже что нет.
источник

A

Alex in Moscow Spark
подымите уровень логирования на org.apache.hadoop и посмотрите что за запросы уходили и где висит
источник

A

Alex in Moscow Spark
такие ошибки на тест кластерах в 1-2 ноды видел, когда до уровня репликации догнать не могли, не хватало нод
источник

N

Nail in Moscow Spark
Есть настройка в спарке binaryAsString
источник

ПБ

Повелитель Бури... in Moscow Spark
спасибо щас поищу, а то когда кастую в строку

решил через  hex(x["поле"]))
источник

АМ

Антон Морзавченков... in Moscow Spark
Коллеги, всем привет, подскажите плиз работаю в pyspark, нужно загрузить spark df в Clickhouse (размер примерно 5 млрд записей * 30 столбцов) , как это можно сделать? И могу ли я это сделать через pyspark или придется писать tsv файл и уже его в Clickhouse?
источник

ПБ

Повелитель Бури... in Moscow Spark
через пандас пробовали?
источник

ЕГ

Евгений Глотов... in Moscow Spark
Есть спарк кликхаус коннектор
источник

АМ

Антон Морзавченков... in Moscow Spark
Где-то слышал, что он медленный, не знаешь случайно для моего объема данных хватит?
источник

ЕГ

Евгений Глотов... in Moscow Spark
Я им не пользовался пока, но в целом это не супер гигантский объём
источник

АМ

Антон Морзавченков... in Moscow Spark
А ето как?)
источник

АМ

Антон Морзавченков... in Moscow Spark
Понял, спасибо
источник

V

Vitaly in Moscow Spark
Спасибо
источник

NN

No Name in Moscow Spark
+
источник

АК

Александр Кунцевич... in Moscow Spark
Вопрос. Есть ли возможность работы с ванильным хадупом из C#. Что-то аналогичное библиотеки работы с озером данных Azure?
источник