Телеграмм чат группы ruairflow страница 1276

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Airflow

1077 membersпожаловаться на группу

2021 January 18

ST

Sergey Tarasenko in Airflow

Почему спрашиваю - у нас датадантистов человек 20, и мы прям заморачивались чтоб даги прям в момент паковались и улетали. Людям очень понравилось

источник

22:33пожаловаться #1

ST

Sergey Tarasenko in Airflow

При том что до этого пайплайн занимал около 15 минут

источник

22:34пожаловаться #2

AS

Artem Shevchenko in Airflow

@krasina15 расскажи пожалуйста как вы этого добились))

источник

22:35пожаловаться #3

VS

Vladislav 👻 Shishkov... in Airflow

У нас их чуть больше и мы делали, чтобы каждая команда/человек были почти независимы, ибо важнее сделать изолированность для ДС, чем каждому соблюдать условие "сидим на этой версии либы"

источник

22:35пожаловаться #4

VS

Vladislav 👻 Shishkov... in Airflow

А то что код доезжает до стейджа 5 минут, ну вот вообще пофиг, на фоне того, сколько он разрабатывается

источник

22:35пожаловаться #5

VS

Vladislav 👻 Shishkov... in Airflow

Я так понимаю, дсы у вас на чистом питоне без специфичных либ сидят? Т.е. никакие плюсы не нужны, либы компилить и собирать не надо? Спарк-сабмиты подготавливать тоже не надо?

источник

22:41пожаловаться #6

VS

Vladislav 👻 Shishkov... in Airflow

Просто непонятно, как вы сделали "моментом упаковку" и какой код приходит от разрабов? Ибо запаковать в зипку - это тоже время, причем не малое

источник

22:42пожаловаться #7

ST

Sergey Tarasenko in Airflow

Vladislav 👻 Shishkov

Просто непонятно, как вы сделали "моментом упаковку" и какой код приходит от разрабов? Ибо запаковать в зипку - это тоже время, причем не малое

15 секунд от кода до дагов в эйрфлоу, сейчас уже засыпаю, как будет время - напишу подробнее

источник

23:00пожаловаться #8

2021 January 19

VS

Vladislav 👻 Shishkov... in Airflow

А 200+ либ зависимостей вы не учитываете? 😬

источник

01:21пожаловаться #9

ME

Max Efremov in Airflow

А можно просто файлики с заменой закинуть по ssh 😂

источник

01:23пожаловаться #10

ME

Max Efremov in Airflow

Тоже довольно быстро, правда пока без тестов(

источник

01:23пожаловаться #11

ДН

Дмитрий Негреев... in Airflow

mkalinin

Люди, кто работает через Kubernetes Executor (когда таск запускается в отдельном поде), подскажите плиз, как мониторите работу с подами? Кто нибудь вычисляет время запуска пода? Буду рад полезным ссылкам

Если хотите время запуска пода - собирайте метрики с kubelet, учётка привилегированная нужна правда.
Щас подумываем чтобы это делать через sidecar контейнеры, но выглядит сложнее.

источник

05:22пожаловаться #12

m

mkalinin in Airflow

Sergey Tarasenko

grafana для смотреть, influx для хранить, telegtaf как агент и ручная обвязка логики внутри python кода

Вопрос был вообще не про это)))

источник

10:04пожаловаться #13

ST

Sergey Tarasenko in Airflow

mkalinin

Вопрос был вообще не про это)))

тогда получается и ответ получился совсем не про то)))

источник

10:05пожаловаться #14

m

mkalinin in Airflow

Дмитрий Негреев

Если хотите время запуска пода - собирайте метрики с kubelet, учётка привилегированная нужна правда.
Щас подумываем чтобы это делать через sidecar контейнеры, но выглядит сложнее.

Спасибо за адекватный фидбек. Именно из-за специфики с привилегиями в корп кубере у меня и возникли такие вопросы. Мониторинг самого аирфлоу позволяет считать лаг между ожидаемым и фактическим стартом даграна (dagrun...delay), а время на поднятие подов в офиц доке аирфлоу рекомендуют через стрим некого Kubernetes watcher'а - может это и есть kubelet? Не поможете полезной ссылкой по теме?
--
Насчёт sidecar контейнеров - а какие метрики с подов в этом случае появятся? Метрики жизни самого пода и его состояний?

источник

10:23пожаловаться #15

m

mkalinin in Airflow

Метрики приложения аирфлоу из подов разве возможны? Или с подов как раз и будут метрики воркера и оператор саксесс /фейл?

источник

10:25пожаловаться #16

ДН

Дмитрий Негреев... in Airflow

mkalinin

Спасибо за адекватный фидбек. Именно из-за специфики с привилегиями в корп кубере у меня и возникли такие вопросы. Мониторинг самого аирфлоу позволяет считать лаг между ожидаемым и фактическим стартом даграна (dagrun...delay), а время на поднятие подов в офиц доке аирфлоу рекомендуют через стрим некого Kubernetes watcher'а - может это и есть kubelet? Не поможете полезной ссылкой по теме?
--
Насчёт sidecar контейнеров - а какие метрики с подов в этом случае появятся? Метрики жизни самого пода и его состояний?

Ну наверно можно и через watcher смотреть. У нас команда администрирующая куб дает нам сама эти метрики, чтоб не насоветовать ерунды, лучше спросите где-то еще)
С sidecar нам больше интересны cpu/memory метрики, их можно как вариант получать из cgroup (можно и из kubelet, но у нас там свои особенности).

Ну дефолтные метрики же вроде читаются из базы всегда, какая разница как у вас задачи в af запускаются.

источник

10:31пожаловаться #17

m

mkalinin in Airflow

Дмитрий Негреев

Ну наверно можно и через watcher смотреть. У нас команда администрирующая куб дает нам сама эти метрики, чтоб не насоветовать ерунды, лучше спросите где-то еще)
С sidecar нам больше интересны cpu/memory метрики, их можно как вариант получать из cgroup (можно и из kubelet, но у нас там свои особенности).

Ну дефолтные метрики же вроде читаются из базы всегда, какая разница как у вас задачи в af запускаются.

Ок,спасибо за пояснения.
....
По дефолтным метрикам...
при использовании Kubernetes Executor часть аирфлоу метрик отсутствуют, к примеру ti_success, ti_failed и ещё несколько. Потому и ищу обходные пути

источник

10:50пожаловаться #18

NB

Nikita Bolotin in Airflow

Всем привет.
Подскажите пожалуйста причину или укажите на ссылку, почему gunicorn webserver-а рестартует worker-ов.
Я подозреваю, чтобы увидеть новые даги, но не могу нигде найти подтверждение

источник

15:16пожаловаться #19

GB

Georgy Borodin in Airflow

Nikita Bolotin

Всем привет.
Подскажите пожалуйста причину или укажите на ссылку, почему gunicorn webserver-а рестартует worker-ов.
Я подозреваю, чтобы увидеть новые даги, но не могу нигде найти подтверждение

Точно не для парсинга дагов, есть такой параметр worker_refresh_batch_size https://airflow.apache.org/docs/apache-airflow/stable/configurations-ref.html#worker-refresh-batch-size, в зависимости от его значения, Airflow будет иногда грохать воркеров и поднимать новых. Зачем? Наверное, имеет смысл смотреть код. Но у них часто есть решения вида "если что-то деградирует – ребутай чаще"

источник

15:25пожаловаться #20