Size: a a a

2021 February 16

im

igor musinov in Airflow
Я правильно понимаю, что если pipeline быстрый и частотный  (скажем 1 мин) и если задачи при этом легковесны то надо с нуля просто делать свои сервисы и всё прочее? Или есть готовые интересные решения в области pipelin-ов для таких задач?
источник

А

Адиль in Airflow
igor musinov
Я правильно понимаю, что если pipeline быстрый и частотный  (скажем 1 мин) и если задачи при этом легковесны то надо с нуля просто делать свои сервисы и всё прочее? Или есть готовые интересные решения в области pipelin-ов для таких задач?
вопрос стоит ли брать для этого Airflow?
источник

➔m

➔◾ maria myznikova... in Airflow
Адиль
вопрос стоит ли брать для этого Airflow?
Ну может, он просто уже есть, поэтому такой вопрос, стоит ли прям вот усердствовать и брать что-то еще
источник

А

Адиль in Airflow
ну вот для быстрых и без всяких overхедов может подойти и Luigi
источник

А

Адиль in Airflow
Airflow тоже подходит, если не смущает вагон зависимостей
источник

VS

Vladislav 👻 Shishkov... in Airflow
igor musinov
Я правильно понимаю, что если pipeline быстрый и частотный  (скажем 1 мин) и если задачи при этом легковесны то надо с нуля просто делать свои сервисы и всё прочее? Или есть готовые интересные решения в области pipelin-ов для таких задач?
Не понимаю, как зависит частота пайплайна и какие то ваши сервисы, но стоит понимать, чем чаще идет запуск джобов, тем меньше нужно оверхеда для этого запуска, а это значит больше ресурсов и тюнинг везде и всего
источник

VS

Vladislav 👻 Shishkov... in Airflow
Ну и да, airflow не гарантирует запуск джобов ровно по таймингу
источник

VS

Vladislav 👻 Shishkov... in Airflow
Если надо часто что-то делать, проще перевести на стриминг
источник

ОБ

Олег Большаков... in Airflow
Коллеги, еще вопрос: нужно дергать хранимку MS SQL Server получать из нее пару сотен строчек данных, и класть их в PostgresSQL. Подскажите, как правильно это делать?
источник

im

igor musinov in Airflow
Адиль
Airflow тоже подходит, если не смущает вагон зависимостей
https://medium.com/@manuelmourato25/when-airflow-isnt-fast-enough-distributed-orchestration-of-multiple-small-workloads-with-celery-afb3daebe611

1. Разве для  airflow  при быстрых задачах не будет оверхеда?
2. Что делать с логами и ui ведь для таких частотных задач ими нельзя пользоваться внутри airflow?
источник

im

igor musinov in Airflow
Vladislav 👻 Shishkov
Не понимаю, как зависит частота пайплайна и какие то ваши сервисы, но стоит понимать, чем чаще идет запуск джобов, тем меньше нужно оверхеда для этого запуска, а это значит больше ресурсов и тюнинг везде и всего
Не очень понял почему если чаще идёт Джоба то меньше оверхеда
источник

VS

Vladislav 👻 Shishkov... in Airflow
Нужно меньше оверхеда, а не меньше оверхеда
источник

im

igor musinov in Airflow
Vladislav 👻 Shishkov
Нужно меньше оверхеда, а не меньше оверхеда
Я имею в виду оверхед от пересылок сообщений обновления бд airflow и прочее . Что заметно на гант диаграмме
источник

VS

Vladislav 👻 Shishkov... in Airflow
Я вас не понимаю
источник

im

igor musinov in Airflow
источник

VS

Vladislav 👻 Shishkov... in Airflow
И?
источник

А

Адиль in Airflow
igor musinov
https://medium.com/@manuelmourato25/when-airflow-isnt-fast-enough-distributed-orchestration-of-multiple-small-workloads-with-celery-afb3daebe611

1. Разве для  airflow  при быстрых задачах не будет оверхеда?
2. Что делать с логами и ui ведь для таких частотных задач ими нельзя пользоваться внутри airflow?
поэтому я предложил Luigi :)
а второй вопрос я не понял, почему нельзя пользоваться?
источник

А

Адиль in Airflow
если Celery, то ещё проще это RQ
источник

P

Pavel in Airflow
гит луиджи
источник

P

Pavel in Airflow
гит эйрфлоу
источник