Size: a a a

2021 March 25

K

KrivdaTheTriewe in Airflow
тот же код
источник

GB

Georgy Borodin in Airflow
KrivdaTheTriewe
Он старые даги не удаляет автоматически, которых физически нет уже, там есть какой патч или нет?
Ты про то, уберёт ли он даги из метадб?
источник

K

KrivdaTheTriewe in Airflow
из ui не убирает
источник

GB

Georgy Borodin in Airflow
KrivdaTheTriewe
из ui не убирает
Ну он и не должен, это типа журнала дагранов
источник

K

KrivdaTheTriewe in Airflow
Georgy Borodin
Ну он и не должен, это типа журнала дагранов
как раз таки должен убирать
источник

K

KrivdaTheTriewe in Airflow
в старых версиях эирфлоу эта штука периодически ломалась
источник

GB

Georgy Borodin in Airflow
KrivdaTheTriewe
как раз таки должен убирать
Хм, странно. Вроде же даг раны должны оставаться 🤔
источник

K

KrivdaTheTriewe in Airflow
Georgy Borodin
Хм, странно. Вроде же даг раны должны оставаться 🤔
Просто это поведение, меняется от версии к версии, и я все больше хочу эирфлоу на скале
источник

RF

Ruslan Fialkovsky in Airflow
Georgy Borodin
Если я не ошибаюсь, то максимальное количество коннектов считается так:
sql_alchemy_pool_size * (parallelism + 1)

Ну и оверфлоу ещё

UPD: даже так

(sql_alchemy_pool_size + sql_alchemy_max_overflow) * max_threads + 1[Dag processor Manager] + 1[Main scheduler process]
32 ядра на воркере - parallelism ставить 30?
pool_size дефолтный 5 норм?
ну т.е. мне на два воркера где-то надо max_connection 500? если с запасом
источник

GB

Georgy Borodin in Airflow
KrivdaTheTriewe
Просто это поведение, меняется от версии к версии, и я все больше хочу эирфлоу на скале
Ну вот кстати ровно сегодня поднимал тестовое окружение и прогонял dags list, файла уже не было, но даг есть в списке.

И даже не помню, чтобы было иначе (но я с эирфлоу версии где-то с 1.10.*)
источник

GB

Georgy Borodin in Airflow
Ruslan Fialkovsky
32 ядра на воркере - parallelism ставить 30?
pool_size дефолтный 5 норм?
ну т.е. мне на два воркера где-то надо max_connection 500? если с запасом
Посмотри в доке сначала про назначение этих конфиг-параметров, потом ставь)

parallelism – это про количество тасков, которые могут единовременно крутиться в твоём  эирфлоу (100 дагов по 1 таску запустили одновременно, параллелизм – 50, значит, половина будет ждать, ну очень грубо говоря)
источник

RF

Ruslan Fialkovsky in Airflow
есть 150 дагов, но они конечно не все одновременно стартуют
источник

GB

Georgy Borodin in Airflow
Ruslan Fialkovsky
32 ядра на воркере - parallelism ставить 30?
pool_size дефолтный 5 норм?
ну т.е. мне на два воркера где-то надо max_connection 500? если с запасом
У меня, кстати, такие результаты, как на диаграмме с ~50 воркерами в пики нагрузок
источник

K

KrivdaTheTriewe in Airflow
Ребята, а вы делали что то вроде volume per dag или как то еще, чтобы передавать стейт между  тасками
источник

GB

Georgy Borodin in Airflow
KrivdaTheTriewe
Ребята, а вы делали что то вроде volume per dag или как то еще, чтобы передавать стейт между  тасками
Опиши, о чём ты: тебе надо пушить что-то через xcom/переменные или данные промежуточно складывать куда-то?
источник

K

KrivdaTheTriewe in Airflow
Промежуточно складывать куда-то файлики
источник

K

KrivdaTheTriewe in Airflow
хком совмем не приятная штука
источник

GB

Georgy Borodin in Airflow
KrivdaTheTriewe
хком совмем не приятная штука
Ну да, он ещё и ограничен размером
источник

GB

Georgy Borodin in Airflow
Промежуточное хранилище зависит полностью от того, как у тебя задеплоен airflow. У нас всё в авс-е – поэтому у нас s3 и прочее
источник

K

KrivdaTheTriewe in Airflow
ну допустим есть s3
источник