Телеграмм чат группы moscowspark страница 527

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Moscow Spark

938 membersпожаловаться на группу

2021 January 26

EC

Eugene Chipizubov in Moscow Spark

изврат

источник

01:16пожаловаться #1

ПФ

Паша Финкельштейн... in Moscow Spark

Eugene Chipizubov

тут еще выяснилось, что если переусердствовать, то можно сломать row_page_size в паркете и он из hdfs больше не прочитается

о, а получается поломанный паркет или просто не пишется?

источник

01:17пожаловаться #2

EC

Eugene Chipizubov in Moscow Spark

да, успешно пишет

источник

01:17пожаловаться #3

EC

Eugene Chipizubov in Moscow Spark

но потом обратно в df уже не превращается

источник

01:17пожаловаться #4

EC

Eugene Chipizubov in Moscow Spark

Caused by: java.lang.IllegalArgumentException: Illegal Capacity: -21

источник

01:18пожаловаться #5

EC

Eugene Chipizubov in Moscow Spark

некоторые паркеты при этом размером под 50G каждый

источник

01:18пожаловаться #6

EC

Eugene Chipizubov in Moscow Spark

ой, народ спит, пардон

источник

01:19пожаловаться #7

ПФ

Паша Финкельштейн... in Moscow Spark

А можешь мне прислать какой-нибудь маленький, если так можно сделать?

источник

01:20пожаловаться #8

EC

Eugene Chipizubov in Moscow Spark

да, давай завтра попробую искусственно сгенерить один

источник

01:21пожаловаться #9

EC

Eugene Chipizubov in Moscow Spark

внутри медицина, нельзя оригинал

источник

01:21пожаловаться #10

С

Сюткин in Moscow Spark

Eugene Chipizubov

да, давай завтра попробую искусственно сгенерить один

и скинешь пример как сохраняешь?

источник

01:22пожаловаться #11

EC

Eugene Chipizubov in Moscow Spark

да

источник

01:22пожаловаться #12

ПФ

Паша Финкельштейн... in Moscow Spark

Eugene Chipizubov

да, давай завтра попробую искусственно сгенерить один

Спасибо! Я бы его сам посмотрел и в наш тестсет добавил

источник

01:22пожаловаться #13

EC

Eugene Chipizubov in Moscow Spark

тебе спасиб

источник

01:23пожаловаться #14

Д

Дмитрий in Moscow Spark

spark.sql.parquet.writeLegacyFormat попробуй.

источник

08:08пожаловаться #15

K

KrivdaTheTriewe in Moscow Spark

а какие сча ноутбуки есть с поддержкой спарк 3 из коробки

источник

15:26пожаловаться #16

K

KrivdaTheTriewe in Moscow Spark

он премис)

источник

15:27пожаловаться #17

e

er@essbase.ru in Moscow Spark

https://toree.apache.org/

источник

15:36пожаловаться #18

D

Datamove in Moscow Spark

Привет, спарщики!
У меня такая проблема - не могу побороть. Установил старенький дистрибутив HDP 3.1 и заменил в нем папку spark2 на более свежий 2.4.7 после некоторого шаманства с установкой переменных это рабает как надо.
Однако при добавлении опций динамической аллокации, работать перестает с ошибками типа
Caused by: org.apache.hadoop.yarn.exceptions.InvalidAuxServiceException: The auxService:spark_shuffle does not exist
в yarn-site.xml определены классы и пути для spark_shuffle и spark2_shuffle.
В yarn.nodemanager.aux-services стоит spark2_shuffle, но добавить spark_shuffle, то теперь огибка на экзекуторах другая - не стартует этот сервис на порту 7337. При этом spark2_shuffle использует 7447, как пишут.
Но я не понимаю, на самом деле - на правлильном пути ли я с этим?
Кому-то удавалось побороть настройки динамической аллокации при таком апгрейде?

источник

16:11пожаловаться #19

EC

Eugene Chipizubov in Moscow Spark

я наверняка неправильно помню, но у себя решил просто апгрейдом до spark-3.0.1-yarn-shuffle.jar

источник

16:58пожаловаться #20