Size: a a a

2020 March 16

С

Сюткин in Moscow Spark
А почему не можешь df?

Сделай collect на limit 1 проверь на поле а дальше через переменную
источник

IK

Ilya Kozyrev in Moscow Spark
потому что занимаюсь кодогенерацией по конфигам в SQL =) Нужно минимизировать логику вне конфигов.
источник

АБ

Аслан Байрамкулов... in Moscow Spark
Всем привет! Подскажите, пожалуйста, есть ли в pyspark аналог sklearn.metrics.pairwise_distances, или нужно вручную создавать?

P.S. нагуглить не получается
источник

ИК

Иван Калининский... in Moscow Spark
Ilya Kozyrev
потому что занимаюсь кодогенерацией по конфигам в SQL =) Нужно минимизировать логику вне конфигов.
Пробуй
explain select * from table_or_view
Получившийся вывод нужно будет парсить и искать в нем название поля. Как это сделать в чистом SQL не представляю, но может удача улыбнется^^
источник

IK

Ilya Kozyrev in Moscow Spark
ахах, спасибо)) Извращением тут занимаюсь
источник

R

Renarde in Moscow Spark
Ilya Kozyrev
ахах, спасибо)) Извращением тут занимаюсь
если я не ошибаюсь и если метаданные лежат в hive, то можно напрямую в хайвовую табличку кинуть запрос типа:
select count(1) from metadata_table where table_name = some and column_name = some
источник

R

Renarde in Moscow Spark
но как называется эта metadata_table я не помню хоть убей, надо чекнуть
источник

R

Renarde in Moscow Spark
в крайнем случае - подключиться через SparkSQL по jdbc к этой хайв бд и посмотреть что там в ней есть
источник
2020 March 17

C

Combot in Moscow Spark
Tesla News has been banned! Reason: CAS ban.
источник

ЕГ

Евгений Глотов... in Moscow Spark
AndroS
ребят, наверное уже сталкивались с таким. В hive была изменена meta информация таблицы. Spark видит старую версию. Как его пропушить?
Не надо так(
источник

ЕГ

Евгений Глотов... in Moscow Spark
Потом два года будете разгребать
источник

ЕГ

Евгений Глотов... in Moscow Spark
Лучше старую переименовать, создать новую со старым именем, и залить в неё данные из старой
источник

ЕГ

Евгений Глотов... in Moscow Spark
Иначе там может один баг хайва на другой наложиться, вообще читаться данные не будут
источник

A

AndroS in Moscow Spark
Евгений Глотов
Иначе там может один баг хайва на другой наложиться, вообще читаться данные не будут
Да, я уже понял. Будем переделывать. Объём большой)
источник

ЕГ

Евгений Глотов... in Moscow Spark
AndroS
Да, я уже понял. Будем переделывать. Объём большой)
Чем больше объём, тем больше потом разгребать...)
источник
2020 March 18

ПФ

Паша Финкельштейн... in Moscow Spark
Привет! У меня сложный вопрос: кто понимает как контролируется спарковый кодген? Я пишу кастомный сериалайзер, но у меня почему-то вместо правильного моего типа в сгенерированном коде фигурирует InternalRow. Куда смотреть?
источник

N

Nikolay in Moscow Spark
Вопрос не совсем понятен. Он и должен же быть InternalRow
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Nikolay
Вопрос не совсем понятен. Он и должен же быть InternalRow
Разве? То есть case классы тоже выглядят как InternalRow?
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Тогда я не знаю как там работает аналог вот такого:
/* 046 */         funcResult_0 = value_3.getId();
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Если value_3 — это InternalRow то понятно что никакого getId() у него нет
источник