Size: a a a

2020 December 22

M

Mi in Moscow Spark
тут вообще главная проблема в том, что в моей задаче я данные не могу никак менять и перестраивать, такая схема есть и задача стоит читать из нее самые нужные версии в соответствии с этими референсами
источник

EC

Eugene Chipizubov in Moscow Spark
Пардон, но выглядит так, как будто хотим избавиться от join с референсной табличкой суть метаданные. Тут уж, что дешевле доработать.
источник

EC

Eugene Chipizubov in Moscow Spark
Еще покопаю, как extension пилить, давно хотел разобраться, может и до load доберусь (
источник
2020 December 23

Н

Никита in Moscow Spark
Привет, кто--нибудь запускает SparkSqlOperator через YARN? У меня никак не получается пишет UnknownHostException и мой докер образ
источник

e

er@essbase.ru in Moscow Spark
Скажите пж. я правильно понимаю что AirFlow для Spark это просто *запускатель* scala программ ? Т.е.  нет инструментов , которые объединяли бы исходный код и расписание для его выполнения
источник

ПФ

Паша Финкельштейн... in Moscow Spark
er@essbase.ru
Скажите пж. я правильно понимаю что AirFlow для Spark это просто *запускатель* scala программ ? Т.е.  нет инструментов , которые объединяли бы исходный код и расписание для его выполнения
Airflow не для spark, он просто оркестратор, так же как, например, luigi или дженкинс
источник

e

er@essbase.ru in Moscow Spark
Что посоветуете?)
источник

ПФ

Паша Финкельштейн... in Moscow Spark
er@essbase.ru
Что посоветуете?)
Airflow
источник

АЖ

Андрей Жуков... in Moscow Spark
er@essbase.ru
Что посоветуете?)
а что надо-то?
источник

АЖ

Андрей Жуков... in Moscow Spark
одновременно билдить и запускать?
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Андрей Жуков
одновременно билдить и запускать?
Ну видимо хочется иметь @Schedule аннотацию прямо в коде
источник

e

er@essbase.ru in Moscow Spark
Да, исключить шаг перекладки jar на кластер.  Что бы все было в одном месте.
источник

АЖ

Андрей Жуков... in Moscow Spark
зашедулить скалабилд!
источник

АЖ

Андрей Жуков... in Moscow Spark
ну а вообще я иногда и монструозные даги из репы airflow уношу в отдельную
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Строго говоря если Airflow запущен на машинах в кластере - то никакой перекладки нет
источник

АЖ

Андрей Жуков... in Moscow Spark
а доставить через CI все на один кластер - это вообще не проблема
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Вы можете написать свой собственный простой оркестратор на quartz, который будет запускать Спарк прямо из своего кода
источник

ПФ

Паша Финкельштейн... in Moscow Spark
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Вот пример
источник

e

er@essbase.ru in Moscow Spark
Java vs Scala API

народ, скажите знаете ли вы хоть какие то примеры того когда java API было не достаточно и нужно было решать задача через scala ?
источник