Size: a a a

2020 October 09

MD

Mikhail Dubkov in Airflow
Max Efremov
Какой endpoint?
Я про host
источник

MD

Mikhail Dubkov in Airflow
Дмитрий Негреев
Там надо в extras вписывать почти все, посмотрите как s3hook параметры считывает
Попробую через extras
источник

ME

Max Efremov in Airflow
я думаю оно само через бото3 всё найдет, нужно только ключ и пароль
источник
2020 October 10

C

Combot in Airflow
Добро пожаловать в самое дружелюбное комьюнити.
источник

AA

Anton Afonin in Airflow
источник
2020 October 11

ks

kuzya shishkin in Airflow
раз тут зашёл разговор про логи
нужно подружить airflow и graylog, кто-то сталкивался с таким? думаю, что раз у меня воркеры и план плащик крутятся в докер контейнерах, может писать из лол не в файл, а в stdin и забирать из как-то
источник

AK

Anvar Khamidov in Airflow
Коллеги, доброе утро.
Дописал полный даг, полную цепочку алгоритма.
НА данный момент нужно сделать периодичесикй запуск на проверку файлов на бакете, если все ок то запускается даг, если нет, то будет отдыхать.

Подскажите куда копать насчет периодечкого запуска

А по реализации на данный момент, функционал по проверке файлов на бакете есть в самом даге, то есть если файл нашелся то записываем его в таблицу соответсвующую и идет далее выполнять все блоки функционала независимо будут новые файлы или нет. Есть люди, кто такую штуку реализовывал?
источник

AK

Anvar Khamidov in Airflow
Разобрался с периодическим запуском.

Сейчас вопросик стоит насчет чекера.
Сам чекер у меня в даге, последовательно запускаются и другие питон операторы.

Как сделать так, чтобы не были лишние вычесления? Чтобы программа умела проверять идти дальше для загрузки данных или же нет
источник

I

Igor in Airflow
Часто делают тогда первый шаг это чекер который или идёт во все тяжкие остальной цепочки или в ветку "ничего не делаем", гуглить branch python operator
источник

I

Igor in Airflow
Другой вариант если там данные примерно в это время приходят но типа плюс минус десять минут то лучше использовать сенсор: по сути пока callable не вернёт true, будет перезапускаться и не давать пройти дальше по пайплайну
источник

ДН

Дмитрий Негреев... in Airflow
kuzya shishkin
раз тут зашёл разговор про логи
нужно подружить airflow и graylog, кто-то сталкивался с таким? думаю, что раз у меня воркеры и план плащик крутятся в докер контейнерах, может писать из лол не в файл, а в stdin и забирать из как-то
если ничего не путаю, то при настройке выгрузки в elastic там как раз происходит перенаправление всех логов в stdout
теоретически можно rsyslog (или чем там скрейпит грейлог) настроить на скейпинг и все
источник

ВБ

Виталий Бикташев... in Airflow
Igor
Часто делают тогда первый шаг это чекер который или идёт во все тяжкие остальной цепочки или в ветку "ничего не делаем", гуглить branch python operator
ShortCircuitOperator лучше подходит, не?
источник

AK

Anvar Khamidov in Airflow
Igor
Часто делают тогда первый шаг это чекер который или идёт во все тяжкие остальной цепочки или в ветку "ничего не делаем", гуглить branch python operator
первый шаг у меня чекер
источник

AK

Anvar Khamidov in Airflow
Спасибо, сейчас поизучаю
источник

AK

Anvar Khamidov in Airflow
А что если замутить sql sensor перед всем этим?
источник

AK

Anvar Khamidov in Airflow
после чекера
источник

PA

Panchenko Andrey in Airflow
Чекер и сенсор несут одну и ту же смысловую нагрузку
источник

PA

Panchenko Andrey in Airflow
Вам файлы нужно чекать или таблицу в бд?
источник

PA

Panchenko Andrey in Airflow
Как уже написали коллеги выше, используйте расписание и сенсор таким образом вы покроете вашу задачу
источник

PA

Panchenko Andrey in Airflow
И сенсор это ваш ентри поинт для старта всего дага
источник