Size: a a a

2021 February 24

dp

dbdbdb pssp in Airflow
Georgy Borodin
Airflow – не для потоковой обработки данных, между тасками должно быть промежуточное хранилище
типо мне нужно смотреть в сторону NIFI?
источник

VS

Vladislav 👻 Shishkov... in Airflow
столько соощений, но почему-то решили цитировать самое неверное 🤔
источник

dp

dbdbdb pssp in Airflow
я не могу делать в рамках одного таска, может что то не понимаю. вот кейс, я делаю запросы к soap батчами, ответ надо ждать 15 минут, за 15 минут в теории может случится всё что угодно, интернет  упасть , вернуть ошибку . Результат батча после обработать.
источник

dp

dbdbdb pssp in Airflow
в теории у меня одновременно может быть штук 15-20 таких запросов к Soap которые ждут ответа , и я пока посмотрев несколько туториалов не уверен как правильно положить задачу в концепт  эирфлоу
источник

MZ

Maxim Zadonskiy in Airflow
Народ если самому на Python писать ETL там буквально к двум источникам, это долго и какие библиотеки использовать?
источник

VS

Vladislav 👻 Shishkov... in Airflow
dbdbdb pssp
я не могу делать в рамках одного таска, может что то не понимаю. вот кейс, я делаю запросы к soap батчами, ответ надо ждать 15 минут, за 15 минут в теории может случится всё что угодно, интернет  упасть , вернуть ошибку . Результат батча после обработать.
Сохраняйте
источник

VS

Vladislav 👻 Shishkov... in Airflow
Maxim Zadonskiy
Народ если самому на Python писать ETL там буквально к двум источникам, это долго и какие библиотеки использовать?
Берете либу для подключения источнике, берете какой-нибудь пандас, берете либу для подключения к таргету
источник

SG

Sergey Gavrilov in Airflow
Народ, тут вроде раньше был разговор о том, что использовать KubeOperator неок. Подскажите, что более подходящее?
источник

MZ

Maxim Zadonskiy in Airflow
Vladislav 👻 Shishkov
Берете либу для подключения источнике, берете какой-нибудь пандас, берете либу для подключения к таргету
Какая либа для подключения к источнику и к таргету. А хранилище как создавать?
источник

GB

Georgy Borodin in Airflow
Maxim Zadonskiy
Какая либа для подключения к источнику и к таргету. А хранилище как создавать?
Какие источники – такие и либы, какие данные – такое и хранилище, тут же не чат битвы экстрасенсов)
источник

VS

Vladislav 👻 Shishkov... in Airflow
Maxim Zadonskiy
Какая либа для подключения к источнику и к таргету. А хранилище как создавать?
По проектированию хранилищ есть уйма книжек, гугл или яндекс их точно найдет, Кимбалл и Инмон ключевые фразы.
И по своему опыту отвечу, что каждое хранилище уникально, каждый лепит как может/хочет/будет и очень многое зависит от инструментов
источник
2021 February 25

z

zxyzxy in Airflow
Sergey Gavrilov
Народ, тут вроде раньше был разговор о том, что использовать KubeOperator неок. Подскажите, что более подходящее?
А почему не ок, можно уточнить?
источник

SG

Sergey Gavrilov in Airflow
zxyzxy
А почему не ок, можно уточнить?
Да я не помню, но здесь в чате неоднократно мелькали фырканья на эту тему
источник

DK

Damir Kuskildin in Airflow
Доброе утро. Подскажите как удалить/почистить старые удаленные даги
Из общего списка
источник

DK

Damir Kuskildin in Airflow
источник

AA

Anton Afonin in Airflow
Damir Kuskildin
Доброе утро. Подскажите как удалить/почистить старые удаленные даги
Из общего списка
Там кнопочка с красным крестиком есть)
источник

DK

Damir Kuskildin in Airflow
Не получается : DAG with not found. Cannot delete
источник

DK

Damir Kuskildin in Airflow
Вроде надо чистить где-то в логах
источник

VS

Vladislav 👻 Shishkov... in Airflow
Сначало надо было удалить в вебке, а потом только файлы. Сейчас уже надо чистить в базе
источник

GB

Georgy Borodin in Airflow
Damir Kuskildin
Не получается : DAG with not found. Cannot delete
https://github.com/teamclairvoyant/airflow-maintenance-dags/tree/master/clear-missing-dags имеет смысл попробовать
UPD: первая ссылочка вела не туда, я заменил
источник