Size: a a a

2021 February 18

ПФ

Паша Финкельштейн... in Moscow Spark
О, я бы тоже посмотрел!
источник

e

er@essbase.ru in Moscow Spark
Курсера
источник

e

er@essbase.ru in Moscow Spark
О-Рейли
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Чо, прям списки задачек?
источник

e

er@essbase.ru in Moscow Spark
er@essbase.ru
О-Рейли
источник
2021 February 19

АА

Артем Анистратов... in Moscow Spark
Ребят, могли бы подсказать есть ли способ сохранять датафрейм в топик кафки, которого еще нет? Условно поведение saveAsTable, которое создает табличку если таковой нет.
источник

t

tenKe in Moscow Spark
в кафке есть опция, которая топики автоматом создает
источник

АА

Артем Анистратов... in Moscow Spark
Понял, спасибо
источник

M

Maksim in Moscow Spark
Привет! А как можно python UDF зарегистрировать и вызвать в spark-scala коде ?)
источник

t

tenKe in Moscow Spark
@pomadchin Гриша ты же вроде делал чето такое
источник

GP

Grigory Pomadchin in Moscow Spark
давно было) не помню честно говоря чем кончилось; если не помню значит ни чем хорошим
источник

GP

Grigory Pomadchin in Moscow Spark
Это точно возможно но я не знаю поддерживает ли это апи сейчас (раньше - нет)
источник

M

Maksim in Moscow Spark
Понял, буду разбираться)
источник

ИК

Иван Калининский... in Moscow Spark
Коллеги, как можно получить InternalRow из некоторых значений, которые есть в Row? Просто создать InternalRow.fromSeq(field_names.map(f => row.getAs[Any](f))) вызывает через некоторое время исключение
java.lang.ClassCastException: java.lang.String cannot be cast to org.apache.spark.unsafe.types.UTF8String
at org.apache.spark.sql.catalyst.expressions.BaseGenericInternalRow$class.getUTF8String(rows.scala:46)

Вообще, есть где-нибудь годное описание InternalRow, как создать, как менять, как сделать клёво)) ? В ближайшее время буду очень много с ним работать
источник

ИК

Иван Калининский... in Moscow Spark
Поправил вопрос, в исходниках была коллекция, а я оставил apply вместо fromSeq. Но что-то всё равно не так
источник

ИК

Иван Калининский... in Moscow Spark
Раскопал в исходниках и сделал как там:
InternalRow.fromSeq(fields.map(f => Literal.create(row.getAs[Any](f.name), f.dataType).value))
Выглядит чуть сложнее и тип пришлось подтягивать, но работает. Правда теперь атрибуты несогласованы, но это уже другая проблема
источник

ИК

Иван Калининский... in Moscow Spark
Наладил атрибуты (поля), можно двигаться дальше.
Спасибо, вы отличная публика!))
источник

t

tenKe in Moscow Spark
Иван Калининский
Коллеги, как можно получить InternalRow из некоторых значений, которые есть в Row? Просто создать InternalRow.fromSeq(field_names.map(f => row.getAs[Any](f))) вызывает через некоторое время исключение
java.lang.ClassCastException: java.lang.String cannot be cast to org.apache.spark.unsafe.types.UTF8String
at org.apache.spark.sql.catalyst.expressions.BaseGenericInternalRow$class.getUTF8String(rows.scala:46)

Вообще, есть где-нибудь годное описание InternalRow, как создать, как менять, как сделать клёво)) ? В ближайшее время буду очень много с ним работать
не
источник

t

tenKe in Moscow Spark
поищи RowDecoder
источник

t

tenKe in Moscow Spark
он умеет
источник