Телеграмм чат группы moscowspark страница 540

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Moscow Spark

938 membersпожаловаться на группу

2021 February 09

EC

Eugene Chipizubov in Moscow Spark

в сборках с хадупом, тупо не работает

источник

19:44пожаловаться #1

EC

Eugene Chipizubov in Moscow Spark

начинаются претензии к guava, guice... и т.д.

источник

19:44пожаловаться #2

EC

Eugene Chipizubov in Moscow Spark

https://issues.apache.org/jira/browse/HIVE-16081

hive напрямую работает

источник

19:45пожаловаться #3

EC

Eugene Chipizubov in Moscow Spark

а в спарке нет

источник

19:45пожаловаться #4

A

Alex in Moscow Spark

правильно

источник

19:45пожаловаться #5

A

Alex in Moscow Spark

потому что спарк создаёт подключение весело =)

в изолированном класлоадере

источник

19:46пожаловаться #6

EC

Eugene Chipizubov in Moscow Spark

а как ему shims подменить?

источник

19:46пожаловаться #7

EC

Eugene Chipizubov in Moscow Spark

я уж hive-shims-common-3.1.2.jar пробовал, ему все равно

источник

19:46пожаловаться #8

EC

Eugene Chipizubov in Moscow Spark

сейчас попробую сборку сделать с hdp3.3.0

источник

19:47пожаловаться #9

A

Alex in Moscow Spark

"spark.sql.hive.metastore.version" = "3.1.1"
"spark.sql.hive.metastore.jars" = "/usr/hdp/current/hive-client/lib/*:./*"

источник

19:47пожаловаться #10

A

Alex in Moscow Spark

не нужно подменять, параметрами спарка говоришь что версия не buildin, а бери с диска

источник

19:48пожаловаться #11

A

Alex in Moscow Spark

если хдп то либы там будут

источник

19:48пожаловаться #12

A

Alex in Moscow Spark

https://spark.apache.org/docs/latest/sql-data-sources-hive-tables.html#interacting-with-different-versions-of-hive-metastore

источник

19:49пожаловаться #13

ИК

Иван Калининский... in Moscow Spark

Кто-нибудь может подсказать почему Спарк при записи двух больших партиций с
repartition(my_col, rand * 8)+ writer.partitionBy(my_col) все равно оставляет большие жирные партиции и не учитывает никак rand?

попробуй указать целевое количество файлов (и побольше, побольше))

источник

19:57пожаловаться #14

EC

Eugene Chipizubov in Moscow Spark

если хдп то либы там будут

кажется понял ошибку, в этом кейсе я указывал HIVE_HOME/lib

источник

20:03пожаловаться #15

EC

Eugene Chipizubov in Moscow Spark

попробуем сейчас

источник

20:04пожаловаться #16

A

Alex in Moscow Spark

они не резолвят переменные окружения, нужен полный путь

источник

20:04пожаловаться #17

M

Mi in Moscow Spark

Иван Калининский

попробуй указать целевое количество файлов (и побольше, побольше))

А разве есть такой параметр? Вообще как я понял это связано с partitionBy, выделяется ровно по одному екзекутору на запись

источник

20:06пожаловаться #18

ИК

Иван Калининский... in Moscow Spark

А разве есть такой параметр? Вообще как я понял это связано с partitionBy, выделяется ровно по одному екзекутору на запись

.repartition(n, expr1, expr2).write.partitionBy()…
вот это n поставь побольше, может быть получится

источник

20:07пожаловаться #19

M

Mi in Moscow Spark

Иван Калининский

.repartition(n, expr1, expr2).write.partitionBy()…
вот это n поставь побольше, может быть получится

Пробовал, не работает

источник

20:08пожаловаться #20