Size: a a a

2020 September 14

ДН

Дмитрий Негреев... in Airflow
Для прома куча готовых экспортеров есть, может вам что-то подойдёт
источник

VA

Vladislav Akatov in Airflow
То есть я правильно понимаю, что если у меня только пара Microsoft SQL базенок, то лучше б я на SSIS делал ETL? Или это дело вкуса всё-таки
источник

DS

Dmitry Samoylov in Airflow
Дмитрий Негреев
Ну абсолютно любой мониторинг можно собирать прометеем например.
Пишете скрипт, который в определенном формате экспозит метрику (api на кучу языков есть) на какой-то там порт.
Поднимаете пром и его джобу для скрейпа метрики (конфиг простой).
Он себе под ноги складывает значения (не рекомендуется долгое хранение), можете какую-нибудь promql совместимую бд для бэкэнда заюзать, сам пром не очень в качестве хранилища.
Ну и дальше графана и promql запросы для дашборда.
Спасибо, понял, что Вы имеете ввиду. Да, это альтернатива, согласен.  Но тут неприятно становится деплоить и управлять данными скриптами (например быстрый вкл/выкл), которых может быть 50+. Т.е. тут без генератора конфигурационного файла или ansible не обойтись. По поводу получения метрик - да, все как Вы и сказали. Основной вопрос именно запуск скриптов в независимых pod'ах, а также управление ими.
источник

DS

Dmitry Samoylov in Airflow
К слову мониторинг бизнес метрик имеется ввиду.
источник

ДН

Дмитрий Негреев... in Airflow
Dmitry Samoylov
Спасибо, понял, что Вы имеете ввиду. Да, это альтернатива, согласен.  Но тут неприятно становится деплоить и управлять данными скриптами (например быстрый вкл/выкл), которых может быть 50+. Т.е. тут без генератора конфигурационного файла или ansible не обойтись. По поводу получения метрик - да, все как Вы и сказали. Основной вопрос именно запуск скриптов в независимых pod'ах, а также управление ими.
Тогда непонятно чего вы мониторить хотите, и зачем вам каждую метрику в независимом поде держать.
источник

ДН

Дмитрий Негреев... in Airflow
Да ещё и выключать/включать их десятками.
источник

DS

Dmitry Samoylov in Airflow
Дмитрий Негреев
Тогда непонятно чего вы мониторить хотите, и зачем вам каждую метрику в независимом поде держать.
хочу мониторить бизнес метрики, например, antifraud.
источник

ДН

Дмитрий Негреев... in Airflow
Ну допустим, тут разницы нет что мониторить. Непонятно в чем проблема ими без airflow управлять.
источник

ДН

Дмитрий Негреев... in Airflow
Мне кажется вы больше гемороя получите от лишней нагрузки airflow, чем фантомное удобство от него.
источник

DS

Dmitry Samoylov in Airflow
Спасибо за помощь. Я и хочу собрать мнение грамотных людей, чтобы оценить все за и против)) Если что уже есть работающий airflow на KubernetesExecutor для ETL (ELT) задач.
источник

DS

Dmitry Samoylov in Airflow
Но к нему точно мониторинговые таски привязывать не буду) шедулер все же не резиновый))
источник

ДН

Дмитрий Негреев... in Airflow
Тем более, если вам не разрешают поды по 16 ядер делать, он точно лопнет от таких приколов
источник
2020 September 15

C

Combot in Airflow
Добро пожаловать в самое дружелюбное комьюнити.
источник

VA

Vladislav Akatov in Airflow
Как в оператор передать параметр из запроса? Типа я дёрнул даг курлом, параметр передал в функции, вызывающие код, но в сам e-mail оператор например как передать
источник

NA

Nikita Anshakov in Airflow
xcom push \ pull
источник

NA

Nikita Anshakov in Airflow
и потом шаблонизотором достать
{{ task_instance.xcom_pull(task_ids='calc_max_dt') }}
?
источник

VA

Vladislav Akatov in Airflow
а есть код где-нибудь? Так не понятно
источник

VA

Vladislav Akatov in Airflow
Ладно понял спасибо
источник

AA

Anton Afonin in Airflow
Vladislav Akatov
а есть код где-нибудь? Так не понятно
источник
2020 September 16

VN

Vova Narovchatskiy in Airflow
Коллеги, добрый день!
Испытываю проблемы с запуском SparkSubmitOperator-a из удаленного сервера (который содержит эйрфлоу).
Коннект осуществляется  и задача стартует, но падает сразу же на моменте обращения к таблице - выбрасывается AnalysisException: Table or view not found .... UnresolvedRelation .... Данный сбой я наблюдаю в yarn логах на кластере, где мы запускаем задачу.
В hive-site.xml hive warehouse установлена в /user/hive/warehouse, но LOCATION установлен  в /res/relugar/test_db/tables_db. Сам параметр spark.sql.warehouse.dir пробовал в разные места устанавливать, но как итог всегда одна ошибка
Любая помощь очень нужна для меня
источник