Size: a a a

2020 July 27

VN

Viacheslav Nefedov in Airflow
примерно так. Стандартных операторов не используем, всё через кастом питон
источник

SG

Sergey Gavrilov in Airflow
Viacheslav Nefedov
Оффлан/онлайн перегон? У нас как сделано - airflow может запускать либо задачи на MS SQL, либо задачи на Clickhouse, либо задачи на сервере спарк. Спарк-задача начинается с загрузки откуда-то данных, а заканчивается тем, что он их куда-то кладёт. Т.е. ставим задачу MS SQL, например, выбрать данные и сложить у себя в отдельную таблицу. Следующий таск - спарк обрабатывает данные, закидывает на hdfs. Следующий таск - Clickhouse забирает данные с hdfs. Следующий - трём данные в hdfs.
То есть, у вас это не про риал-тайм аналитику, правильно?
источник

VN

Viacheslav Nefedov in Airflow
Sergey Gavrilov
То есть, у вас это не про риал-тайм аналитику, правильно?
Да, конечно. Раз в час расписание, получается до двух часов отставание
источник

S

Shadilan R16 MU Rost... in Airflow
Онлайн как мне кажется это же не совсем про airflow...
источник

VN

Viacheslav Nefedov in Airflow
думали если быстрее делать, то нужно что-то типа uber cadence
источник

VN

Viacheslav Nefedov in Airflow
по поводу онлайна ждём 2.0, там вроде получше должно быть
источник

VN

Viacheslav Nefedov in Airflow
возможно ещё prefect вариант, но мы его испугались
источник

VN

Viacheslav Nefedov in Airflow
Dmitry Tataurov
Кстати, из всех ограничений на текущий момент только знаю, что флоу в облаке можно организовывать в проекты. В локальном шедулере пока нельзя ну и по мелочи недоработки типа url к шедулеру агенту нужно через переменную окружения прописать, что не задокументировано почему-то, а по дефолту был localhost. Где то недавно видел, что в облаке у них в планах тоже предоставить бесплатную подписку. У создателя проблема - он не знает как лучше монетизировать продукт и пока всё идёт к платной поддержке. Если найду линк, то скину.
Дмитрий, а вы airflow использовали?
источник

DT

Dmitry Tataurov in Airflow
Viacheslav Nefedov
Дмитрий, а вы airflow использовали?
Вначале начали, но не пошло. Показалось неудобно (субъективно), особенно отладка и деплой. Сейчас airflow используется как запускалка для docker
источник

SG

Sergey Gavrilov in Airflow
Shadilan R16 MU Rostov
Онлайн как мне кажется это же не совсем про airflow...
Тут скорее был вопрос про другие инструменты, которые используются
источник

S

Shadilan R16 MU Rost... in Airflow
о спасибо упустил нить беседы. ну и удивился про сочетание онлайна и эйрфлоу...
источник

DT

Dmitry Tataurov in Airflow
Кстати, сразу словили баг, который висит под задачкой AIRFLOW-6431 пункт 3
источник

P

Pavel in Airflow
Встречал кто?
failed to create fsnotify watcher: too many open files
источник

M

Mikhail in Airflow
какая платформа?
источник

M

Mikhail in Airflow
и какой экзекутор?
источник

P

Pavel in Airflow
это видоизмененный k8S-экзекуютор. такая ошибка вываливается на этапе чтения логов контейнера из куба
источник

P

Pavel in Airflow
это не родной KubernetesPodExecutor, это почти этот же экзекютор, но запускает он не поды, а джобы
источник

M

Mikhail in Airflow
ну это какая-то юниксовая штука с ulimit
источник

M

Mikhail in Airflow
типа открыто больше дескрипторов файлов чем разрешает ОС
источник

P

Pavel in Airflow
да, очень похоже. может у кого было на практике может кто пофиксил
источник