Size: a a a

2021 March 17

DN

Dmitriy Novikov in Airflow
Евгений Кузнецов
сейчас я вижу у себя такое решение прод бд ->  airflow -> dwh (тоже КХ) -> MV -> шардирование в чистовой КХ -> Tableau
если прям реалтайм то airflow мне кажется не лучший вариант... но тут могу ошибаться, не силен в инструменте
источник

ЕК

Евгений Кузнецов... in Airflow
Dmitriy Novikov
ну так тригер на инсерт, я правда не уверен что можно, но попробовать если указать в качестве движка удаленную машину... там есть такие движки
потому и спросил) мы пытались такое реализовать и ответ там нет, не получится
источник

DN

Dmitriy Novikov in Airflow
Евгений Кузнецов
потому и спросил) мы пытались такое реализовать и ответ там нет, не получится
жаль жаль
источник

ЕК

Евгений Кузнецов... in Airflow
на текущий момент нужно поднять систему отчетности и там дозволительна задержка в 5-10 минут
источник

yk

y k in Airflow
Airflow это все таки батчевая загрузка, если нужен рмалтайм то это Кафка конечно
источник

DN

Dmitriy Novikov in Airflow
y k
Airflow это все таки батчевая загрузка, если нужен рмалтайм то это Кафка конечно
смотря какая у них нагрузка, может и rabbitMQ хватит
источник

ME

Max Efremov in Airflow
Кафка, спарк, флинк, найфай, стримсеты...
источник

yk

y k in Airflow
Хотя я знаю случаи когда в кликхауз гоняли данные посредством аэрфлоу
источник

ЕК

Евгений Кузнецов... in Airflow
я сейчас делаю это через дженкинс и распараллеленный скрипт питона
источник

ЕК

Евгений Кузнецов... in Airflow
мелкими батчами все хорошо относительно работает, пока хочется перевести все эти процессы на airflow пототму что я задолбался пилить кусками скрипты,  а потом еще следить чтобы они не конфликтовали по ресурсам =)
источник

yk

y k in Airflow
Вот вот мелкие батчи vs поток
источник

ЕК

Евгений Кузнецов... in Airflow
хорошо, если я все таки хочу упороться в батчи на текущий момент, что мне можно глянуть чтобы реализовать инкрементальную загрузку?
источник

DN

Dmitriy Novikov in Airflow
тут кто то рекоманедваол мелкую приблуду для диванного реалтайма но вот хз увидит ли он моё сообщение
источник

ЕК

Евгений Кузнецов... in Airflow
Мелкая приблуда меня уже не спасёт) 11 млн событий сутки в одном проекте, 300к событий в минуту в другом :) мне тут нужна туррель)
источник
2021 March 18

DN

Dmitriy Novikov in Airflow
Евгений Кузнецов
Мелкая приблуда меня уже не спасёт) 11 млн событий сутки в одном проекте, 300к событий в минуту в другом :) мне тут нужна туррель)
11 млн событий  это немного совсем, 300к в минуту уже серьезней, смотрите в сторону брокеров, airflow из этой цепочки лучше выпилить
источник

AP

Anton Patsev in Airflow
Коллеги, гуглю и не могу найти как правильно обновлять dag, если airflow в kubernetes. Кто-нибудь может подсказать?
источник

ME

Max Efremov in Airflow
А ему какие-то специальные даги нужны?
источник

AP

Anton Patsev in Airflow
кастомные даги
источник

v

vasiliy in Airflow
Anton Patsev
Коллеги, гуглю и не могу найти как правильно обновлять dag, если airflow в kubernetes. Кто-нибудь может подсказать?
Гляньте в офф чарте, там есть пример использования сайдкар контейнера, git-sync  вроде. По дефолту каждую минуту пулит репу
источник

AP

Anton Patsev in Airflow
Спасибо. Посмотрю
источник