Всем привет! Тестируем перформанс Airflow - пытаемся выжать максимум по количеству task instance, способных одновременно быть в статусе running.
Столкнулись со странной ошибкой:
0 task instances в статусе running, но в базе (Postgres) висит 1000 connections, которые ещё что-то пишут туда.
Сначала думали, что проблема в CeleryWorkers и конфиге worker_autoscale=800,200. У нас 5 воркеров, при таком конфиге они держат запущенными по 200 сабпроцессов каждый. Как раз 1000 получается.
Но при запуске дагов максимум достигается 600 тасок в running (600 слотов), дальше упираемся в limit коннекшенов базе. То есть открываются новые 600 коннекшенов в дополнение к этим левым 1000.
Есть идеи?