Size: a a a

2020 December 08

ME

Max Efremov in Airflow
if date:
 t1>>t2
else:
 t1>>t3
источник

ME

Max Efremov in Airflow
Будет 2 разных дага
источник

AI

Anton Illarionov in Airflow
речь наверное про запуск таски
можно заюзать BranchPythonOperator
источник

DN

Dmitriy Novikov in Airflow
спасибо, наверн оно, попробую
источник

KG

Koala Gaming in Airflow
Добрый день, коллеги. Нужно ваше мнение и совет. Считаете ли вы нужным использовать ORM классы в построении ETL процесса или же в большинстве случаев лучше и проще писать SQL запросы? Может быть вы можете подсказать best practices
источник

VS

Vladislav 👻 Shishkov... in Airflow
templates for sql
источник

KG

Koala Gaming in Airflow
До текущего момента была достаточно на все операции с базами SQL и pandas. Но сейчас есть ощущение, что использовать ORM более надёжный вариант
источник

VS

Vladislav 👻 Shishkov... in Airflow
для ORM надо слишком много изменений по коду делать, при активно развивающем ETL
источник

KG

Koala Gaming in Airflow
Vladislav 👻 Shishkov
для ORM надо слишком много изменений по коду делать, при активно развивающем ETL
да и это пугает
источник

K

KrivdaTheTriewe in Airflow
Koala Gaming
Добрый день, коллеги. Нужно ваше мнение и совет. Считаете ли вы нужным использовать ORM классы в построении ETL процесса или же в большинстве случаев лучше и проще писать SQL запросы? Может быть вы можете подсказать best practices
На spark можно перейти :)
источник

VS

Vladislav 👻 Shishkov... in Airflow
только не говори, что spark - это orm 😬
источник

K

KrivdaTheTriewe in Airflow
Vladislav 👻 Shishkov
только не говори, что spark - это orm 😬
Ну  spark.read.jdbc.as[Case class] и дальше на scala пишешь всю логику ) потом  обратно
источник
2020 December 09

O

Olegа in Airflow
Всем привет, скажите пожалуйста, правильно ли я понимаю, что чтобы мне активировать dag, мне нужно засунуть скрипт в $AIRFLOW_HOME/dags?
Что делать если у моего файла есть зависимости? Я все это добро пихаю туда и все?)
источник

ME

Max Efremov in Airflow
Olegа
Всем привет, скажите пожалуйста, правильно ли я понимаю, что чтобы мне активировать dag, мне нужно засунуть скрипт в $AIRFLOW_HOME/dags?
Что делать если у моего файла есть зависимости? Я все это добро пихаю туда и все?)
Ещё в UI включить его потом)
источник

ME

Max Efremov in Airflow
Пакеты доставить пипом можно, например
источник

ME

Max Efremov in Airflow
У меня в папке дагов сами даги, а в подпапках разные штуки для них лежат
источник

ME

Max Efremov in Airflow
Общий функции и такое всё
источник

O

Olegа in Airflow
во, это то что хотел услышать, спасибо)
источник
2020 December 10

Н

Никита in Airflow
Всем привет.
Никто не сталкивался с проблемой, при включении нескольких дагов падает шедулер, с разными ошибками, есть подозрение что какая-то проблема с пулами при подключении к БД.
Ошибки такие:
sqlalchemy.exc.OperationalError: (psycopg2.OperationalError) SSL SYSCALL error: EOF detected
sqlalchemy.exc.DatabaseError: (psycopg2.DatabaseError) SSL error: sslv3 alert bad record mac
sqlalchemy.exc.DatabaseError: (psycopg2.DatabaseError) server closed the connection unexpectedly
       This probably means the server terminated abnormally
       before or while processing the request.

Postgres 10.15 локально
Airflow в докере:
Ubunthu 14.04
Python 2.7.6
Airflow 1.9.0
SQLAlchemy 1.3.20
psycopg2 2.6.1
источник

PA

Panchenko Andrey in Airflow
так а разве пайтон для аирфлоу не рекомендован не ниже 3.6.5?
источник