Size: a a a

2021 March 12

A

Antony in Moscow Spark
Y
А у вас spark 3.1 и выше? Просто в документации указана эта версия, а у нас 2.4 стоит
у нас тоже
источник

Y

Y in Moscow Spark
Спасибо ребята за подсказки)
источник
2021 March 15

IK

Ilya Kozyrev in Moscow Spark
Привет! Возник вопрос загрузки данных из SAP BW, жуть проперитарная ещё та. Может у кого то был опыт такого взаимодействия? к HANA можно подцепиться через JDBC а вот с BW беда какая-то
источник

N

Nikita Blagodarnyy in Moscow Spark
Ilya Kozyrev
Привет! Возник вопрос загрузки данных из SAP BW, жуть проперитарная ещё та. Может у кого то был опыт такого взаимодействия? к HANA можно подцепиться через JDBC а вот с BW беда какая-то
У них вроде по лицензии только из веб сервиса можно тянуть.
источник

IK

Ilya Kozyrev in Moscow Spark
нарыл чо можно через RFC вытаскивать ипользуя jco саповский, только вот мейвене какая-то старая версия лежит
источник

G

Gev in Moscow Spark
Народ. Подскажите, может кто решил такую проблему. Мне надо переписать набор партиций в папке. Если задать mode(ovewrite).partitionBy(‘part).parquet(“/tmp”) то это грохает все что есть в папке и пишет туда новый список партиций. А мне надо чтобы оно переписало только те партиции что есть в partitionBy
источник

G

Gev in Moscow Spark
Я уже думал писать рядом и перезаписывать партиции. Но мне кажется это как то коряво
источник

G

Georgy in Moscow Spark
Ilya Kozyrev
нарыл чо можно через RFC вытаскивать ипользуя jco саповский, только вот мейвене какая-то старая версия лежит
Sap jco либа самим сапом распространяется, через их сайт
источник

NN

No Name in Moscow Spark
Gev
Я уже думал писать рядом и перезаписывать партиции. Но мне кажется это как то коряво
Установи spark.sql.sources.partitionOverwriteMode в dynamic, и пиши в табличку как .mode("append").insertInto(tablename, overwrite=True)
источник

G

Gev in Moscow Spark
У меня spark 2.2. там по моему нет этого параметра. Он появился в 2.3.  И у меня нет таблицы
источник

NN

No Name in Moscow Spark
Gev
У меня spark 2.2. там по моему нет этого параметра. Он появился в 2.3.  И у меня нет таблицы
Тогда надо гуглить
источник

G

Gev in Moscow Spark
Да вот уже гуглю. Решения как бы не могу найти
источник

G

Gev in Moscow Spark
Моет есть какой то рецепт удалить партиции?
источник

AS

Anton Solomonov in Moscow Spark
Добрый вечер. Почему может быть такое:
я читаю таблицу1 из hive в датафрейм,
потом делаю union с другим датафреймом
и результат сохраняют в эту же таблицу1 с этой же партицией

В итоге партиция таблицы куда записываю обнуляется.

Может нельзя сохранять в ту таблицу из которой производится чтение ?
источник

AB

Andrey Bel in Moscow Spark
Anton Solomonov
Добрый вечер. Почему может быть такое:
я читаю таблицу1 из hive в датафрейм,
потом делаю union с другим датафреймом
и результат сохраняют в эту же таблицу1 с этой же партицией

В итоге партиция таблицы куда записываю обнуляется.

Может нельзя сохранять в ту таблицу из которой производится чтение ?
если правильно понял то у вас не работает аппенд?
в спарке обычно оверврайт идет да
источник

AS

Anton Solomonov in Moscow Spark
Append выдаёт что я пытаюсь подставить null значения. Хотя это не так.

По факту получается что append что overwrite записывают пустой датафрейм
источник

AB

Andrey Bel in Moscow Spark
Anton Solomonov
Append выдаёт что я пытаюсь подставить null значения. Хотя это не так.

По факту получается что append что overwrite записывают пустой датафрейм
а те партиция поулчается пустая по итогу совсем?
источник

AS

Anton Solomonov in Moscow Spark
Да
источник

AB

Andrey Bel in Moscow Spark
Anton Solomonov
Да
оч странно -  по логике значит вы пишите пустой дф в  эту партицию
источник

AB

Andrey Bel in Moscow Spark
а вы проверяли что там есть данные? хотя бы шоу или каунт?
источник