Телеграмм чат группы ruairflow страница 1333

Всем привет! Есть лог ошибки выполнения таски, по таймауту. Локально все отрабатывает, а на сервере возникает таймаут для определённой модели. Подскажите пожалуйста что тут может быть или как протестировать. Заранее извините, если нет подробной инфы, надежда что у кого то подобное случалось...

источник

16:34пожаловаться #15

🌌[

🌌El.Randir/42ᅠ [AD]... in Airflow

Если это все логи, то ГГ
НО вкратце: он к чему-то не может подключится, вот и всё.

источник

16:35пожаловаться #16

DN

Dmitriy Novikov in Airflow

Всем привет, интересно услышать как архитектурно у вас организован запуск дагов. Для примера я встречал 2 подхода

1 - Все пишем в файле дага, то есть дописываем свои хуки/операторы
2 - Делаем отдельную папку /jobs где лежит вся кодовая база, а через airflow просто запускаем скрипты которые лежать в Jobs

Интересно услышать кто и почему выбрал одну из тактик, или вообще 3 подход. Буду рад советам о том как стоит организовать etl и какие проблемы и ограничения например у первого подхода.

источник

17:02пожаловаться #17

GB

Georgy Borodin in Airflow

Dmitriy Novikov

Всем привет, интересно услышать как архитектурно у вас организован запуск дагов. Для примера я встречал 2 подхода

1 - Все пишем в файле дага, то есть дописываем свои хуки/операторы
2 - Делаем отдельную папку /jobs где лежит вся кодовая база, а через airflow просто запускаем скрипты которые лежать в Jobs

Интересно услышать кто и почему выбрал одну из тактик, или вообще 3 подход. Буду рад советам о том как стоит организовать etl и какие проблемы и ограничения например у первого подхода.

Свои хуки/операторы/классы/функции держим в пакетах на приватном PyPi (в редких случаях – ставим по деплой токену гитлаба).
В самих файлах дага минимальная логика, описание ветвления, ну и очевидные импорты.
А так ничто не мешает складывать всё в одну кучу, просто не оч реюзабельно. Так сделали, потому что ETL-процессы уже были описаны, лежали по своим репозиториям и раньше крутились просто в докер-контейнерах по расписанию

источник

17:10пожаловаться #18

DN

Dmitriy Novikov in Airflow

Спасибо за ответ!

источник

17:10пожаловаться #19

SG

Sergey Gavrilov in Airflow

Dmitriy Novikov

Всем привет, интересно услышать как архитектурно у вас организован запуск дагов. Для примера я встречал 2 подхода

1 - Все пишем в файле дага, то есть дописываем свои хуки/операторы
2 - Делаем отдельную папку /jobs где лежит вся кодовая база, а через airflow просто запускаем скрипты которые лежать в Jobs

Интересно услышать кто и почему выбрал одну из тактик, или вообще 3 подход. Буду рад советам о том как стоит организовать etl и какие проблемы и ограничения например у первого подхода.

Структурирую как обычный питоновый проект, просто на самом верхнем уровне торчат кучи файлов dags_*.py всяких c объявлением дагов и импортами

источник

17:11пожаловаться #20