Size: a a a

2020 September 14

EM

Egor Mateshuk in Airflow
Борис М
и в чем это проявляется? В готовых модулях для всех баз?
в функционале работы с датами, backfill, репроцессинг через clear. то есть изначально закладывается логика "мне нужно будет перезаливать данные в прошлом", что характерно для етл-задач.
источник

VS

Vladislav 👻 Shishkov... in Airflow
Вся прелесть airflow - вам не надо изобретать слой метаданных для какого-нибудь DWH, просто потому, что все это есть из коробки
источник

E

Edya in Airflow
Борис М
Всем привет! Подскажите плз, изучаю аирфлоу. Раньше стоял ssis, вот решил переехать. Такой вопрос, в сисе я мог выстроить непрерывный пайплан "качаем данные из базы а, преобразуем, качаем в б" etl короче. А в аирфлоу столкнулся с тем, что вроде там не получается как-то передать данные между тасками. Т.е. надо скачать данные из а, сохранить в в файлик(s3 или еще что) и дальше из файлика льем в б. Короче аирфлоу что не умеет в инмемори?
Не умеет, можете оперативку смонтировать в tmp - пишите туда файлы. И будет "инмемори" а-ля спарк
источник

БМ

Борис М in Airflow
Vladislav 👻 Shishkov
Возьмите просто задачу перелить по ключу данные из А в Б, и попробуйте перезалить данные, просто потому что на источнике А что-то поменялось
ну я и столкнулся с тем, что в промежутке надо писать в локальный цсвшник
источник

БМ

Борис М in Airflow
ровно когда это делал
источник

VS

Vladislav 👻 Shishkov... in Airflow
Борис М
ну я и столкнулся с тем, что в промежутке надо писать в локальный цсвшник
вы сначало решите задачу выше в рамках одной таски
источник

VS

Vladislav 👻 Shishkov... in Airflow
и сразу поймете, что такое airflow
источник

БМ

Борис М in Airflow
Хорошо, спасибо
источник

БМ

Борис М in Airflow
Edya
Не умеет, можете оперативку смонтировать в tmp - пишите туда файлы. И будет "инмемори" а-ля спарк
оо звучит классно, а где-то можно про это прочитать?
источник

БМ

Борис М in Airflow
поподробнее
источник

VS

Vladislav 👻 Shishkov... in Airflow
Edya
Не умеет, можете оперативку смонтировать в tmp - пишите туда файлы. И будет "инмемори" а-ля спарк
а потом другая таска на другом воркере и привет 😬
источник

VS

Vladislav 👻 Shishkov... in Airflow
не надо такое советовать
источник

ME

Max Efremov in Airflow
Sergey Gavrilov
Припоминаю отличную историю про ЕТЛ на Дженкинсе
Так и на airflow можно ci/cd построить)
источник

E

Edya in Airflow
Vladislav 👻 Shishkov
а потом другая таска на другом воркере и привет 😬
Если там локал экзекьютор - то вполне. Если с умом
источник

VS

Vladislav 👻 Shishkov... in Airflow
Edya
Если там локал экзекьютор - то вполне. Если с умом
если бы да кабы
источник

VS

Vladislav 👻 Shishkov... in Airflow
не надо давать антипаттерн советы
источник

БМ

Борис М in Airflow
Vladislav 👻 Shishkov
а потом другая таска на другом воркере и привет 😬
и что случится?
источник

VS

Vladislav 👻 Shishkov... in Airflow
ничего, ошибка
источник

ME

Max Efremov in Airflow
Борис М
и что случится?
У разных воркеров разные папки будут
источник

ME

Max Efremov in Airflow
Возможно, nfs поможет
источник