Size: a a a

2021 February 05

P

Pavel in Airflow
Dmitry Yakimets
Но как предварительное перекладывание файлов на s3 может помочь? :) Тестирование поможет. Но оно, скорее, на уровне тасков.
Возможно
источник
2021 February 07

C

Combot in Airflow
Добро пожаловать в самое дружелюбное комьюнити.
источник

ИК

Илья Китов in Airflow
У меня свой оператор который передаёт данные из oracle в postgres, соответственно он выполняется одним таском.
Кто нибудь знает как можно задать на один таск два пула. Чтобы источник был отнесён к пулу источника, а приёмник соответственно к пулу приёмника?
источник

VS

Vladislav 👻 Shishkov... in Airflow
А как вы представляете себе, что один таск наполовину выполняется в одном пуле, а другая половина в другом?
источник

ИК

Илья Китов in Airflow
Пополам никак, я представлял, что может можно просто чтобы один таск занял слот и в одном и в другом пуле
источник

ИК

Илья Китов in Airflow
Типо через запятую два пула указать))
источник

VS

Vladislav 👻 Shishkov... in Airflow
Можете попробовать, но поведение будет не то, которое вы ожидаете
источник

VS

Vladislav 👻 Shishkov... in Airflow
Вроде через сабдаг как-то можно решить, но что-то мне подсказывает, что смысла в этом нет
источник

ИК

Илья Китов in Airflow
Похоже на то
источник

ИК

Илья Китов in Airflow
А пул только таску присваивается да? На хук его повесить нельзя?
источник

GB

Georgy Borodin in Airflow
Илья Китов
А пул только таску присваивается да? На хук его повесить нельзя?
Ага. Пул ограничивает сколько тасков можно ставить в очередь.

У нас use case такой: есть таски, выполняющие запрос к бд на обновление партиций для определённых таблиц, но есть лимит от сервиса на одновременное выполнение операций, поэтому такие таски просто складываются в пул, чтобы они не съедали место на воркерах, зависая в try-except-sleep
источник

ИК

Илья Китов in Airflow
Georgy Borodin
Ага. Пул ограничивает сколько тасков можно ставить в очередь.

У нас use case такой: есть таски, выполняющие запрос к бд на обновление партиций для определённых таблиц, но есть лимит от сервиса на одновременное выполнение операций, поэтому такие таски просто складываются в пул, чтобы они не съедали место на воркерах, зависая в try-except-sleep
Получается, пул создаёте для конкретного таска, а не для конкретной БД?
источник

GB

Georgy Borodin in Airflow
Илья Китов
Получается, пул создаёте для конкретного таска, а не для конкретной БД?
Нет, пул назначается таску, просто у нас это свелось до запросов к определённой БД
источник

ИК

Илья Китов in Airflow
Вот да, я просто только разворачиваюсь, и хочу сразу продумать как лучше, для тасков или для бд пулы создавать

Наверное для БД самое оптимальное, чтобы не загрузить сервис, получается что в случае например,создания нового дага по миграции за большой период распараллелить таски можно, и при этом не помешают какие-нибудь старые таски которые уже к этому же БД обращаются.
Вот только вопрос какому таску какой приоритет раздавать тут у меня затык)
источник
2021 February 08

IK

Ivan Kizimenko in Airflow
Заметил что добавили BranchDayOfWeekOperator, может кому то будет полезен.

https://github.com/apache/airflow/pull/13997
источник

AP

Andrey Pak in Airflow
Всем привет. Я захотел начать контрибьютить в airflow и столкнулся с тем, что если я запускаю тесты через pytest то большинство ломается из-за импортов.

Сейчас например не могу установить модуль kerberos. Сижу на 18 убунте через виртуалку.

Кто-нибудь может помочь мне?
источник

DN

Dmitriy Novikov in Airflow
Andrey Pak
Всем привет. Я захотел начать контрибьютить в airflow и столкнулся с тем, что если я запускаю тесты через pytest то большинство ломается из-за импортов.

Сейчас например не могу установить модуль kerberos. Сижу на 18 убунте через виртуалку.

Кто-нибудь может помочь мне?
а через докер не работает тоже?
источник

AP

Andrey Pak in Airflow
Dmitriy Novikov
а через докер не работает тоже?
не пробовал. есть какие-то готовые образы для разработки или просто создать убунту и вручную всё устанавливать?
источник

DN

Dmitriy Novikov in Airflow
Andrey Pak
не пробовал. есть какие-то готовые образы для разработки или просто создать убунту и вручную всё устанавливать?
airflo docker dev ?
источник

AP

Andrey Pak in Airflow
Я не понимаю как потом из контейнера делать PR. Сейчас у меня хотя бы форк на руках и могу править исходники, а в докере будет последняя версия кода?
источник