Хай. Я понимаю, что вопрос тупой и я вроде его задавал. Но я решил вернуться к Airflow и не пойму как мне отслеживать запуски дагов.
Вот у меня в системе появляются объекты. В день хз сколько штук в неопределенное вермя. Мне было бы удобно при их создании через api триггерить запуск дагов для обработки этих объектов. Но как я понимаю, единственный параметр рана - дата.
Как правильно организовать обработку объектов?
я бы сказал, что путь эйрфлоу — сделать сенсоры на эти объекты (например, которые будут дергать внешний api и проходить/валиться по статус-коду ответа, мануалы по написанию сенсоров есть в оф.доке) и поставить их перед обработкой, соответственно скипая всю ветку если объекта нет. Поставить по расписанию на комфортный для вас интервал (зависит от того как часто появляются объекты и какую задержку вы готовы переждать). отслеживать запуски дагов не нужно, если вы готовы к асинхронной обработке.
Если ваше основное и необходимое требование — триггерить обработку сразу при получении объекта, то эйрфлоу вам тут не поможет, так как он не рассчитан на подобное, для шедулера допустимы паузы и сложно настроить хороший порядок исполнения разных дагов, так что проще будет сразу взять не эйрфлоу.