Size: a a a

2020 July 29

E

Evgeny in Airflow
Ильяс Хакиев
airflow initdb делали?
у меня без этого новые даги не добавляются
к сожалению, не помогло
источник

ИХ

Ильяс Хакиев... in Airflow
Evgeny
к сожалению, не помогло
через докер развернуто?
источник

E

Evgeny in Airflow
Ильяс Хакиев
через докер развернуто?
угу
источник

PA

Panchenko Andrey in Airflow
Max Efremov
Вот он висит и ждёт, когда прошлый запуск завершится))) А его вообще нет)
дага с экстернал сенсором стартует одновременно с той дагой которую она прослушивает
источник

ИХ

Ильяс Хакиев... in Airflow
Дмитрий Негреев
подскажите, как правильно импортировать свои пакеты?

разложил пока даги в такую структуру:
|—dags
|     |—pr_1
|              |—__init__.py
|              |—dag1.py
|              |—my_module.py
|—__init__.py

пишу в dag1 - from dags.pr_1.my_module import MyClass
а airflow мне - "No module named 'dags.pr_1'"

пока обычный пукелевский контейнер, добавил PYTHONPATH только в Dockerfile
ENV PYTHONPATH=${AIRFLOW_HOME}:${PYTHONPATH}
читайте вниз
источник

ME

Max Efremov in Airflow
Panchenko Andrey
дага с экстернал сенсором стартует одновременно с той дагой которую она прослушивает
Там в примере она сама себя слушает)
источник

ME

Max Efremov in Airflow
Наверное надо свой сенсор написать, который обработает кейс первого запуска и будет слушать предыдущий результат
источник

PA

Panchenko Andrey in Airflow
Max Efremov
Наверное надо свой сенсор написать, который обработает кейс первого запуска и будет слушать предыдущий результат
стоп, нужно слушать внутри дага или разные даги?
источник

ME

Max Efremov in Airflow
Panchenko Andrey
стоп, нужно слушать внутри дага или разные даги?
Внутри одного дага предыдущий запуск. Чтобы в параллели не работало несколько
источник

PA

Panchenko Andrey in Airflow
то есть если прошлый запуск дага был успешным то выполнять по расписанию завтра например так?
источник

SK

Serhii Kholodniuk in Airflow
тестовый пример взлител, там походу только первый запуск нужно отметить как успешный(для сенсора)
источник

ME

Max Efremov in Airflow
Panchenko Andrey
то есть если прошлый запуск дага был успешным то выполнять по расписанию завтра например так?
Ага, но скорее для бэкфила актуально
источник

ME

Max Efremov in Airflow
А если прошлый зафейлился, то ничего не делать
источник
2020 July 30

A

Aleksey Belyavtsev in Airflow
Подскажите пожалуйста, реализовывал ли кто-то механизм восстановления после падения сервера с AirFlow?
Кейс: есть задача (например запись данных в Greenplum), выполняемая несколько часов, во время выполнения задачи AirFlow падает. Восстанавливаем (если в k8s, то довольно быстро, но всё равно не моментально + это уже "другой" AirFlow в части подключения к Greenplum), и не можем получить никакой информации по статусу выполнения нашей задачи, а за время недоступности она могла быть: a) выполнена, b) ещё находится в процессе выполнения, c) отвалиться.
Понятно, что очевидным выходом из ситуации будет перезапуск всех задач, но на это уйдёт много времени и хотелось бы как-то восстановить состояние до падения.
Может ли как-то помочь DAG Serialization?
источник

VS

Vladislav 👻 Shishkov... in Airflow
логически сериализации не поможет никак
источник

VS

Vladislav 👻 Shishkov... in Airflow
опять таки, что именно упало у вас в airflow? все таки там не один сервис
источник

A

Aleksey Belyavtsev in Airflow
Vladislav 👻 Shishkov
опять таки, что именно упало у вас в airflow? все таки там не один сервис
все сервисы на 1 машине (и в ближайшее время нет возможности их разнести), соответственно падают все разом.
источник

VS

Vladislav 👻 Shishkov... in Airflow
то у вас кубик, то монолит на одной машине 🤔
источник

A

Aleksey Belyavtsev in Airflow
кубик - состояние to-be)
источник

A

Aleksey Belyavtsev in Airflow
может я некорректно написал, допустим мы перевели AirFlow на k8s, всё равно вопрос на мой взгляд остаётся открытым.
источник