Size: a a a

2020 June 23

AS

Alex Sinev in Airflow
George Gaál
как часто надо перезапускать ? как часто поступают новые данные?
скрипт в питоне сейчас кроном вызывается раз в 10-20 минут. И то, там по pid контролируется вызов, чтобы невыполенное задание не перекрылось.
В идеале - как пришли файлики, так их и обрабатывать по триггеру ( Sensor? ). Это раз в 5 минут примерно
источник

AS

Alex Sinev in Airflow
George Gaál
ну, там 10-к других скриптов, причем в виде дерева взаимосвязей
я плохо осознаю зависимости на уровне etl, они сейчас в логике скрипта. Но да, можно разбить на десяток заданий: файлы пришли -> обработали этот -> обработали тот -> отправили задание на перерасчет. как-то так.
источник

AS

Alex Sinev in Airflow
Chern Oleksander
Частично поможет, разобьете каждый файл на задачи и может будет немного легче.
Но лучше полностью поменять концепт
собственно ради концепта и зашел, потому что пока не понимаю, помогут ли мне эти инструменты? Как поменять концепт?
источник

CO

Chern Oleksander in Airflow
Alex Sinev
собственно ради концепта и зашел, потому что пока не понимаю, помогут ли мне эти инструменты? Как поменять концепт?
Ну, прям вот так концепт не предложишь, нужно понимать
От куда вы эти данные берете, в каком обьеме
Можете ли вы переходить на облачные сервисы
Можно ли заменить dbf ( я так понимаю это слив с регионов дневных данных)
Какой бюджет... и вопрос будет очень много
—-
Если из того что вы описали
Разбить весь скрипт на задачи, где одна задача один файл - так как у вас внутри каждого файла своя процедура обработки (но тут можно наткунтся на DeadLock если пишется в одну таблицу, но опять же какой там объем)
И если главную цель вы преследуете это мониторинг отработало/нет
Вы тогда будете видеть большое дерево в котором где-то будет красненькие задачки, в котором будет достаточно легко понять что и куда.
Плюс если вы тригерите файлики и ошибки чаще всего из-за изменения стркутуры или отсутсвия файла или отсутствия связи в AirFlow это будет легче делать
ИМХО
источник

AS

Alex Sinev in Airflow
Chern Oleksander
Ну, прям вот так концепт не предложишь, нужно понимать
От куда вы эти данные берете, в каком обьеме
Можете ли вы переходить на облачные сервисы
Можно ли заменить dbf ( я так понимаю это слив с регионов дневных данных)
Какой бюджет... и вопрос будет очень много
—-
Если из того что вы описали
Разбить весь скрипт на задачи, где одна задача один файл - так как у вас внутри каждого файла своя процедура обработки (но тут можно наткунтся на DeadLock если пишется в одну таблицу, но опять же какой там объем)
И если главную цель вы преследуете это мониторинг отработало/нет
Вы тогда будете видеть большое дерево в котором где-то будет красненькие задачки, в котором будет достаточно легко понять что и куда.
Плюс если вы тригерите файлики и ошибки чаще всего из-за изменения стркутуры или отсутсвия файла или отсутствия связи в AirFlow это будет легче делать
ИМХО
Спасибо, попробую, наверное, разбить скрипт.
источник

ME

Max Efremov in Airflow
Vladislav 👻 Shishkov
нет и не стоит
А в конфиге есть же default_timezone = utc
источник

VS

Vladislav 👻 Shishkov... in Airflow
есть, но грабли тоже есть
источник
2020 June 24

C

Combot in Airflow
Добро пожаловать в самое дружелюбное комьюнити.
источник
2020 June 25

K

KrivdaTheTriewe in Airflow
ребят, а есть какой-нибудь вменяемый способ  сделать следщее: для темплейтед поля  сделать рендеринг, после чего сделать base64 для него, в частности интересуют env для докеоператра
источник

GG

George Gaál in Airflow
ватафак
источник

GG

George Gaál in Airflow
слушай, я русским вроде владею, но ни черта не понял, что ты хочешь
источник

CO

Chern Oleksander in Airflow
George Gaál
слушай, я русским вроде владею, но ни черта не понял, что ты хочешь
)))))
источник

SG

Sergey Gavrilov in Airflow
KrivdaTheTriewe
ребят, а есть какой-нибудь вменяемый способ  сделать следщее: для темплейтед поля  сделать рендеринг, после чего сделать base64 для него, в частности интересуют env для докеоператра
Если я вас правильно понял, то я решал это переписыванием куска Аерфлоу
источник

K

KrivdaTheTriewe in Airflow
Sergey Gavrilov
Если я вас правильно понял, то я решал это переписыванием куска Аерфлоу
ну это допустимый вариант,  есть примеры какие?
источник

K

KrivdaTheTriewe in Airflow
George Gaál
слушай, я русским вроде владею, но ни черта не понял, что ты хочешь
нужно передать в энвайромент докера переменную в base64 , но при этом сделать рендеринг со стороны эирфлоу перед тем как base64 применить
источник

GG

George Gaál in Airflow
Sergey Gavrilov
Если я вас правильно понял, то я решал это переписыванием куска Аерфлоу
ты меня отправил под стул
источник

GG

George Gaál in Airflow
KrivdaTheTriewe
нужно передать в энвайромент докера переменную в base64 , но при этом сделать рендеринг со стороны эирфлоу перед тем как base64 применить
окей. Т.е. ты хочешь закодировать нечто в base64?
источник

SG

Sergey Gavrilov in Airflow
KrivdaTheTriewe
ну это допустимый вариант,  есть примеры какие?
Вот пытаюсь найти, пока неудачно.
источник

SG

Sergey Gavrilov in Airflow
KrivdaTheTriewe
нужно передать в энвайромент докера переменную в base64 , но при этом сделать рендеринг со стороны эирфлоу перед тем как base64 применить
А в докере аерфлоу или кто-то другой?
источник

K

KrivdaTheTriewe in Airflow
George Gaál
окей. Т.е. ты хочешь закодировать нечто в base64?
не нечто, а templated поле
источник