Size: a a a

2020 June 30

YI

Yukari I in Airflow
Если это оракл, то партицию указывать не обязательно. Достаточно хорошего индекса и условия выборки. Да и select * практика плохая.
источник
2020 July 01

C

Combot in Airflow
Добро пожаловать в самое дружелюбное комьюнити.
источник

L

Leo in Airflow
Leo
Кто испытывал проблему с psycopg2.OperationalError: FATAL:  remaining connection slots are reserved for non-replication superuser connections, было ли у вас такое, что эта трабла возникала на таске, никак не связанном с бд? У нас периодически падают DummyOperator таски на вот этом вот
В общем проблема была в том что мы упираемся в max_connections из-за использования SubDag, которые спавнят коннекшены мимо пул
источник

L

Leo in Airflow
причём это всё коннекшены в бд самого airflow, поэтому в логах источника и цели данных ничего странного не было. придётся переписывать даги)
источник

BB

Bral Bral in Airflow
Как оказалось это из-за того, что celery result backend был в postgre. Переправил на redis - полет нормальный уже неделю .
источник

BB

Bral Bral in Airflow
Переслано от Bral Bral
На днях столкнулся с тем , что шедулер просто перестает работать . На ui отображается , как последний хертбит был получен N времени назад . Версия 1.10.10. покопался , нашел свежую тему https://github.com/apache/airflow/issues/7935 . Пишут что нужно запускать с параметром -n .
источник

ВТ

Виктор Титов... in Airflow
кто-нибудь сталкивался с проблемой, что логи тасок не пишутся в соответствующие лог файлы?
источник
2020 July 02

BB

Bral Bral in Airflow
Виктор Титов
кто-нибудь сталкивался с проблемой, что логи тасок не пишутся в соответствующие лог файлы?
В самом даге logger как-то переопределяется ? Или это абсолютно везде
источник

ВТ

Виктор Титов... in Airflow
Bral Bral
В самом даге logger как-то переопределяется ? Или это абсолютно везде
В модуле с тасками дага я создаю логгер из дикт конфига: в логгере три хэндлера, один из них пишет логи в стдаут. Раньше эирфлоу перехватывал стдаут и записывал все это в логи тасок, сейчас логи тасок пустые
источник

ОК

Олег Кулаков... in Airflow
Доброго дня! Сможет кто нибудь помочь? Есть даг выполняющийся по шедулеру раз в сутки. Если триггерить его вручную, то данные переносятся - среднее время выполнения около 2-х минут. Однако при запуске по шедулеру таски выполняются за ~20 сек. помечаются как успешные но данных в целевой бд нет. Уже изменили время запуска по шедулеру, чтобы быть полностью уверенными что в исходной бд вьюха содержит данные. В логах таски ничего конкретного нет (и не очень понятно что залогировать). Другие даги отрабатывают успешно. Версия airflow 1.10.6. Заранее спасибо!
источник

ME

Max Efremov in Airflow
А таски как-то завязаны на время запуска дага?
источник

ОК

Олег Кулаков... in Airflow
Абсолютно нет
источник

ОК

Олег Кулаков... in Airflow
три таски
1)создать темповую таблицу в целевой бд,
2)мигрировать данные из вью исходной бд в темповую таблицу в целевой бд,
3) переименовать темповую бд и отнаследовать от другой таблички
источник

ОК

Олег Кулаков... in Airflow
собственно вопрос то только в миграции которая при запуске по шедулеру отрабатывает успешно но не мигрирует данных между системами
источник

ОК

Олег Кулаков... in Airflow
таска с миграцией данных: 1) select * из исходной бд
источник

ОК

Олег Кулаков... in Airflow
2) insert в целевую бд
источник

YV

Yuliya Volkova in Airflow
Олег Кулаков
Доброго дня! Сможет кто нибудь помочь? Есть даг выполняющийся по шедулеру раз в сутки. Если триггерить его вручную, то данные переносятся - среднее время выполнения около 2-х минут. Однако при запуске по шедулеру таски выполняются за ~20 сек. помечаются как успешные но данных в целевой бд нет. Уже изменили время запуска по шедулеру, чтобы быть полностью уверенными что в исходной бд вьюха содержит данные. В логах таски ничего конкретного нет (и не очень понятно что залогировать). Другие даги отрабатывают успешно. Версия airflow 1.10.6. Заранее спасибо!
если это sql квери, обычно они success просто от выполнения квери, не важно были там данные или нет, имеет смысл сенсор повесить просто в начало, чтобы он прочекал что данные точно есть, если я правильно поняла что вопрос в том, как запускать когда точно данные есть
источник

ОК

Олег Кулаков... in Airflow
Yuliya Volkova
если это sql квери, обычно они success просто от выполнения квери, не важно были там данные или нет, имеет смысл сенсор повесить просто в начало, чтобы он прочекал что данные точно есть, если я правильно поняла что вопрос в том, как запускать когда точно данные есть
данные есть, однако попробую повесить логирование кол-ва данных. спасибо
источник

M

Mikhail in Airflow
Олег Кулаков
собственно вопрос то только в миграции которая при запуске по шедулеру отрабатывает успешно но не мигрирует данных между системами
Какая бд? Через Airflow test пробовали? Учтите что у каждой таски своя сессия
источник

M

Mikhail in Airflow
Поэтому сессионные темп таблицы не прокатят
источник