Size: a a a

2021 February 02

DY

Dmitry Yakimets in Airflow
Спасибо за развёрнутый ответ, очень логично.
источник

OI

Oleg Ilinsky in Airflow
Pavel
Гибкая схема очень.
1. сложность кода этих доп. компонентов на уровне джуна/мидла
2. из 1 следует, что вы имеете полный контроль над этими компонентами
3. если тянуть даги напрямую из гита встает вопрос: как организовать деплой из любой ветки. Деплой из мастера как правило только в розовый мечтах тимлидов из кровавого энтерпрайза, в реальности, в небольших командах регулярно есть необходимость деплоя из своей собственной ветки.
4. возможность построения гибкой схемы хранения на S3. Например, мы при деплое дага указываем его версию, на S3 улетает даг в директорию вида [dag-id]-[version], плюс на этом же уровне лежит файлик current-version с последней версией дага отправленного на деплой.

как-то так... совсем не претендуем на идеальность такой схемы, но она стабильно работает))
А nexus для этих целей не рассматривали? Или с3 просто был и поэтому решили его использовать?
источник

P

Pavel in Airflow
Oleg Ilinsky
А nexus для этих целей не рассматривали? Или с3 просто был и поэтому решили его использовать?
nexus для других целей инструмент)) а s3 да, просто был уже
источник

OI

Oleg Ilinsky in Airflow
Pavel
nexus для других целей инструмент)) а s3 да, просто был уже
ну туда же можно любое г накидать
хоть jar, хоть пейтон, хоть архивы
(на сколько я знаю)
источник

P

Pavel in Airflow
он предполагает работу с немного другим уровнем абстракции: артифакт, ну, и прочее гавно, верно))
а тут тупо директорию с файликами закинуть надо.
источник

OI

Oleg Ilinsky in Airflow
Pavel
он предполагает работу с немного другим уровнем абстракции: артифакт, ну, и прочее гавно, верно))
а тут тупо директорию с файликами закинуть надо.
хм
ну вообще, логично
источник

ИК

Илья Китов in Airflow
Всем привет, есть те, кому приходилось создавать свой contrib.operators.oracle_to_postgres_transfer?
На подобие oracle to oracle
источник

АZ

Антон Z in Airflow
Павел, есть еще вопросы по этой теме:

1 А как проверяется что один даг другой не сломает?
2 Есть тестовый стенд чтобы как то проверять?
3 Как накатываются конфиги?
источник

АZ

Антон Z in Airflow
Переслано от Pavel
Гибкая схема очень.
1. сложность кода этих доп. компонентов на уровне джуна/мидла
2. из 1 следует, что вы имеете полный контроль над этими компонентами
3. если тянуть даги напрямую из гита встает вопрос: как организовать деплой из любой ветки. Деплой из мастера как правило только в розовый мечтах тимлидов из кровавого энтерпрайза, в реальности, в небольших командах регулярно есть необходимость деплоя из своей собственной ветки.
4. возможность построения гибкой схемы хранения на S3. Например, мы при деплое дага указываем его версию, на S3 улетает даг в директорию вида [dag-id]-[version], плюс на этом же уровне лежит файлик current-version с последней версией дага отправленного на деплой.

как-то так... совсем не претендуем на идеальность такой схемы, но она стабильно работает))
источник

DY

Dmitry Yakimets in Airflow
Pavel
Гибкая схема очень.
1. сложность кода этих доп. компонентов на уровне джуна/мидла
2. из 1 следует, что вы имеете полный контроль над этими компонентами
3. если тянуть даги напрямую из гита встает вопрос: как организовать деплой из любой ветки. Деплой из мастера как правило только в розовый мечтах тимлидов из кровавого энтерпрайза, в реальности, в небольших командах регулярно есть необходимость деплоя из своей собственной ветки.
4. возможность построения гибкой схемы хранения на S3. Например, мы при деплое дага указываем его версию, на S3 улетает даг в директорию вида [dag-id]-[version], плюс на этом же уровне лежит файлик current-version с последней версией дага отправленного на деплой.

как-то так... совсем не претендуем на идеальность такой схемы, но она стабильно работает))
Получается, что у вас могут быть dag_xxx_master_v4 и dag_xxx_branch_v2? И все они висят в веб-интерфейсе? Или как-то удаляете старые dag-и?
источник

P

Pavel in Airflow
Dmitry Yakimets
Получается, что у вас могут быть dag_xxx_master_v4 и dag_xxx_branch_v2? И все они висят в веб-интерфейсе? Или как-то удаляете старые dag-и?
если коротко ответить, то - да.
но если более обстоятельно: версия дага меняется только при изменении параметров дат запуска (start, end, schedule), чтобы шедулер смог корректно построить план выполнения нового дага. Об этом, кстати, в доке к airflow сказано.
В этом случае да, висит старая версия дага в интерфейсе, которая не будет работать, её можно удалить либо ручками, либо раз в час её удалит наш скрипт, который подчищает такие orphan-даги
источник

P

Pavel in Airflow
Антон Z
Павел, есть еще вопросы по этой теме:

1 А как проверяется что один даг другой не сломает?
2 Есть тестовый стенд чтобы как то проверять?
3 Как накатываются конфиги?
1. если один даг ломает другой даг, то это очень плохой даг)))
2. отедльного выделенного тестового стенда нет, была задача под это в бэклоге, но отказались пока от отдельной тестовой среды. Вероятно, понадобится с ростом команды и процессов. Все etl процессы у нас построены таким образом, что на 100% воспроизводимы на локальных машинах разработчиков. Если запустилось на локалхосте, то запустится на проде.
3. Про какие конфиги речь?
источник

АZ

Антон Z in Airflow
Pavel
1. если один даг ломает другой даг, то это очень плохой даг)))
2. отедльного выделенного тестового стенда нет, была задача под это в бэклоге, но отказались пока от отдельной тестовой среды. Вероятно, понадобится с ростом команды и процессов. Все etl процессы у нас построены таким образом, что на 100% воспроизводимы на локальных машинах разработчиков. Если запустилось на локалхосте, то запустится на проде.
3. Про какие конфиги речь?
3 Конфиги имеется ввиду Variables
источник

P

Pavel in Airflow
Антон Z
3 Конфиги имеется ввиду Variables
От использования Variables сейчас уходим, переписываем etl с использованием Vault
источник
2021 February 03

М

Михаил in Airflow
Добрый день!
источник

М

Михаил in Airflow
Подскажите как можно получить доступ к JSON вставленному в UI в окне Trigger DAG?
источник

マサ

マキシム サモイロフ... in Airflow
А у вас при триггере ошибки нет? Какая версия? Мы у себя вообще затриггерить не можем
источник

М

Михаил in Airflow
Версия 1.10.10, ошибок не выдает.
источник

ДН

Дмитрий Негреев... in Airflow
Михаил
Подскажите как можно получить доступ к JSON вставленному в UI в окне Trigger DAG?
{{ dag_run.conf[...] }} ?
источник

PA

Panchenko Andrey in Airflow
всем привет, подскажите как называется параметр который отвечает за таймаут между окончанием одной таски внтри дага и началом другой?
источник