Size: a a a

2020 December 12

AB

Alexey Bedrintsev in Airflow
Гуй аэрфлоу, логи и т.д. будут при таком подходе?
источник

M

Mikhail in Airflow
Alexey Bedrintsev
Гуй аэрфлоу, логи и т.д. будут при таком подходе?
а куда он денется?
источник
2020 December 13

VC

Vlad Chek in Airflow
Привет

Не подскажете, как из PythonVirtualenvOperator записать что-то в БД?

- Кастомных хуков он не видит и через requirements их не прокинуть
- xcom не работает с ним как с обычным оператором и вытащить данные не получается

обычный PythonOperator не хотелось бы использовать, чтобы не засорять env либами
источник
2020 December 14

IK

Ivan Kizimenko in Airflow
Это нормально что он так часто   считывает файл?
источник

IK

Ivan Kizimenko in Airflow
Ivan Kizimenko
Это нормально что он так часто   считывает файл?
да, поменял MIN_FILE_PROCESS_INTERVAL стало получше
источник

マサ

マキシム サモイロフ... in Airflow
Да, там в шедулере под капотом работает отдельный тред, который по while-true обрабатывает даги с файловой системы и складывает в базу. Чем больше дагов, тем больше интервалы между считываниями. Вроде как есть возможность задать руками интервал, но это неточно
источник

IK

Ivan Kizimenko in Airflow
а есть команда для принудительного рефреша папки с дагами? Чтоб интервал выставить побольше, а когда что-то прогаешь можно было руками обновлять
источник

SG

Sergey Gavrilov in Airflow
Ivan Kizimenko
Это нормально что он так часто   считывает файл?
Выставите интервал побольше
источник

SG

Sergey Gavrilov in Airflow
Ivan Kizimenko
а есть команда для принудительного рефреша папки с дагами? Чтоб интервал выставить побольше, а когда что-то прогаешь можно было руками обновлять
Честно говоря, никогда не встречал. Но в принципе можно сервак ребутнуть)))
источник

SG

Sergey Gavrilov in Airflow
Ivan Kizimenko
Это нормально что он так часто   считывает файл?
env AIRFLOW__SCHEDULER__MIN_FILE_PROCESS_INTERVAL=10
Ну или, как вы понимаете, в конфиг файле можно выставить
источник

マサ

マキシム サモイロフ... in Airflow
Ivan Kizimenko
а есть команда для принудительного рефреша папки с дагами? Чтоб интервал выставить побольше, а когда что-то прогаешь можно было руками обновлять
Сейчас в кишках эйрфло закодено так, что процессинг файлов является частью scheduler_job, который суть базовый процесс шедулера. Команды через api нету, но думаю можно попробовать дернуть вручную этот самый scheduler_job, как делает это шедулер. Но это темная дорожка, все на свой страх и риск только в случае крайней нужды, как говорится)
источник

GB

Georgy Borodin in Airflow
Sergey Gavrilov
Честно говоря, никогда не встречал. Но в принципе можно сервак ребутнуть)))
python -c "from airflow.models import DagBag; d = DagBag();"
источник

GB

Georgy Borodin in Airflow
Ivan Kizimenko
а есть команда для принудительного рефреша папки с дагами? Чтоб интервал выставить побольше, а когда что-то прогаешь можно было руками обновлять
Это совсем не точно, но может быть ещё airflow list_dags рефрешит
источник

IK

Ivan Kizimenko in Airflow
Georgy Borodin
python -c "from airflow.models import DagBag; d = DagBag();"
Не сработало. КОманда прошла и даже вроде написал
Filling up the DagBag from /opt/airflow/dags
источник

GB

Georgy Borodin in Airflow
Ivan Kizimenko
Не сработало. КОманда прошла и даже вроде написал
Filling up the DagBag from /opt/airflow/dags
Имеет смысл попробовать добавить вызов collect_dags тогда https://airflow.readthedocs.io/en/stable/_api/airflow/models/dagbag/index.html#airflow.models.dagbag.DagBag.collect_dags
источник

P

Pavel in Airflow
Ну чо, кто 1.10.14 поставил?))
источник

A

Andrey in Airflow
Pavel
Ну чо, кто 1.10.14 поставил?))
кто поставил сразу на прод?))
источник

A

Andrey in Airflow
вроде не так много фиксов пришло, но главный вопрос сколько багов пришло :D
источник

IK

Ivan Kizimenko in Airflow
так вроде уже 2.0rc2 выкатили
источник

AA

Anton Afonin in Airflow
Georgy Borodin
Это совсем не точно, но может быть ещё airflow list_dags рефрешит
Неа, не рефрешит
источник