Size: a a a

2020 September 14

VS

Vladislav 👻 Shishkov... in Airflow
кто это сравнивает, ничерта не пользовался airflow как etl
источник

IL

Ilya Lozhkin in Airflow
etl, что аирфлоу не делает?
источник

БМ

Борис М in Airflow
но не увидел этого элемента и начал задумчиво чесать репу "что ты такое"
источник

SG

Sergey Gavrilov in Airflow
Зависит от задачи, крч. Добавьте хранение и пандас - в принципе, уже можно обозвать ETL_системой
источник

БМ

Борис М in Airflow
меня просто жаба душит как-то тратить на чтение/запись
источник

VS

Vladislav 👻 Shishkov... in Airflow
Ilya Lozhkin
etl, что аирфлоу не делает?
все сделает в рамках одной таски
источник

M

Mikhail in Airflow
Борис М
Ну я поэтому и немного удивился, во многом аирфлоу оч часто упоминают рядом со всякими etl и я думал что он близок к ним, поставил, увидел большую часть того что надо)
вы неправильно думаете про него

обычный етл:
оператор вытаскивания — очередь — оператор загрузки

эйрфлоу:
оператор вытаскивания и загрузки
источник

БМ

Борис М in Airflow
Sergey Gavrilov
Зависит от задачи, крч. Добавьте хранение и пандас - в принципе, уже можно обозвать ETL_системой
т.е. просто сувать данные в переменную внутри таска?
источник

M

Mikhail in Airflow
типа постгресоператор он просто дергает SQL
источник

VS

Vladislav 👻 Shishkov... in Airflow
Mikhail
вы неправильно думаете про него

обычный етл:
оператор вытаскивания — очередь — оператор загрузки

эйрфлоу:
оператор вытаскивания и загрузки
airflow тоже может внутри очередь организовать
источник

SG

Sergey Gavrilov in Airflow
Борис М
меня просто жаба душит как-то тратить на чтение/запись
Оооо... По сравнению со скоростью работы самого шедулера, чтение-писание особо времени не требуют
источник

IL

Ilya Lozhkin in Airflow
Mikhail
вы неправильно думаете про него

обычный етл:
оператор вытаскивания — очередь — оператор загрузки

эйрфлоу:
оператор вытаскивания и загрузки
чем не аирфлоу)
источник

M

Mikhail in Airflow
чтоб перелить данные, надо писать PostgresToSomethingOperator
источник

VS

Vladislav 👻 Shishkov... in Airflow
как я сказал - это все в рамках одной таски, но никто же не хочет в рамках одной таски
источник

EM

Egor Mateshuk in Airflow
Борис М
Ну я поэтому и немного удивился, во многом аирфлоу оч часто упоминают рядом со всякими etl и я думал что он близок к ним, поставил, увидел большую часть того что надо)
идея в том, что Airflow отделяет построение пайплайнов обработки данных от самих ETL-инструментов. то есть в Airflow описывается что и когда делать, а движок, который будет эти данные таскать в рамках отдельных тасок выбираете сами. если конкретный движок что-то не может - берете другой, а пайплайны при этом продолжаете спокойно лепить в Airflow.
источник

M

Mikhail in Airflow
ну вот у меня батчи в память влезают
источник

M

Mikhail in Airflow
почему бы и не в рамках
источник

БМ

Борис М in Airflow
Vladislav 👻 Shishkov
как я сказал - это все в рамках одной таски, но никто же не хочет в рамках одной таски
конечно, потому что это пахнет костылем ) тебе же между записей и чтением надо что-то сделать с данными)
источник

M

Mikhail in Airflow
Борис М
конечно, потому что это пахнет костылем ) тебе же между записей и чтением надо что-то сделать с данными)
еще одна разница
источник

SG

Sergey Gavrilov in Airflow
На самом деле это совсем не костыль, а скорее упущенная зияющая дыра
источник