Size: a a a

2020 October 07

ME

Max Efremov in Airflow
а вообще зависит от конкретного случая, наверное. Можно и одним запросом всё покрыть
источник

AK

Anvar Khamidov in Airflow
Panchenko Andrey
А если много файлов?
файлов будет много
источник

AK

Anvar Khamidov in Airflow
У меня к примеру в методе, есть цикл, который берет все новые файлы за сутки и грузит их в clickhouse
источник

ME

Max Efremov in Airflow
можно вон вообще в variables закинуть и чекать
источник

AK

Anvar Khamidov in Airflow
насколько правильно это, я не могу сказать
источник

ME

Max Efremov in Airflow
или в xcom
источник

PA

Panchenko Andrey in Airflow
У меня сенсор на бакет и проверка файлов обработанных и подъехавших
источник

PA

Panchenko Andrey in Airflow
Не жалуюсь
источник

ME

Max Efremov in Airflow
Panchenko Andrey
У меня сенсор на бакет и проверка файлов обработанных и подъехавших
можно лямбдой сделать)
источник

ME

Max Efremov in Airflow
более амазон-нейтив
источник

PA

Panchenko Andrey in Airflow
Та тут не выйиграешь по времени
источник

AK

Anvar Khamidov in Airflow
Panchenko Andrey
У меня сенсор на бакет и проверка файлов обработанных и подъехавших
Хмм, у меня PythonOperator на проверку новых файлов на бакете, если есть то грузит на локалку, чтобы в дальнейшем использовать

Можно же по идее не грузить к себе, а сразу в базу, верно понимаю, так делал кто?
источник

PA

Panchenko Andrey in Airflow
Можно,делал
источник

ME

Max Efremov in Airflow
Anvar Khamidov
Хмм, у меня PythonOperator на проверку новых файлов на бакете, если есть то грузит на локалку, чтобы в дальнейшем использовать

Можно же по идее не грузить к себе, а сразу в базу, верно понимаю, так делал кто?
если кликхаус может забрать из s3
источник

ME

Max Efremov in Airflow
у нас в аврору грузится с s3, но это немного другое
источник

PA

Panchenko Andrey in Airflow
У меня гугл клауд
источник

PA

Panchenko Andrey in Airflow
Из клауда с указанием схемы сразу в таблицу
источник
2020 October 08

ДН

Дмитрий Негреев... in Airflow
@SLASH_CyberPunk скажи плиз, а вы когда расписание у дага меняете, как-то чекаете что у вас зависимости не разрушаются?
awaits {
    z_log_compaction {
      dag = "compactor_daily_23_21_A_A_A"
      task = "compact_z_log_db_z_log"
      timedelta = 3hr37m
    }
    oracle_bl_fct_orderitem_detail {
      dag = "await_bl_fct_orderitem_detail_0_1_A_A_A"
    }
  }
то dag_id меняется же
источник

VS

Vladislav 👻 Shishkov... in Airflow
Дмитрий Негреев
@SLASH_CyberPunk скажи плиз, а вы когда расписание у дага меняете, как-то чекаете что у вас зависимости не разрушаются?
awaits {
    z_log_compaction {
      dag = "compactor_daily_23_21_A_A_A"
      task = "compact_z_log_db_z_log"
      timedelta = 3hr37m
    }
    oracle_bl_fct_orderitem_detail {
      dag = "await_bl_fct_orderitem_detail_0_1_A_A_A"
    }
  }
то dag_id меняется же
Лучше у @sowow359 спросить 😬
источник

N

Nikita in Airflow
Дмитрий Негреев
@SLASH_CyberPunk скажи плиз, а вы когда расписание у дага меняете, как-то чекаете что у вас зависимости не разрушаются?
awaits {
    z_log_compaction {
      dag = "compactor_daily_23_21_A_A_A"
      task = "compact_z_log_db_z_log"
      timedelta = 3hr37m
    }
    oracle_bl_fct_orderitem_detail {
      dag = "await_bl_fct_orderitem_detail_0_1_A_A_A"
    }
  }
то dag_id меняется же
У нас в тестах есть на это проверка, если такой таски/дага нет в dagbag, он об этом заорёт
источник