Size: a a a

2021 February 23

С

Сюткин in Airflow
Sergey Maslow
К сожалению, в чате удаляются ссылки и большие тексты
Ссылки удаляются для новых участников кто практически не общался
источник

GB

Georgy Borodin in Airflow
Sergey Maslow
Да, в докер-компоуз нет инструкции build. Я просто беру ветку puckel/docker-airflow на гитхабе, но проблема в том, что если запускать докер-компоуз, то Airflow не видит библиотеки из requirements.txt, а если отдельно запускать Докерфайл - не запускается.
В описании сервисов в docker-compose есть секция build, изучай документацию
источник

AI

Anton Illarionov in Airflow
Сюткин
Sergey Maslow:
Докер-компоуз выглядит так:

version: '3.7'
services:
   postgres:
       image: postgres:9.6
       environment:
           - POSTGRES_USER=airflow
           - POSTGRES_PASSWORD=airflow
           - POSTGRES_DB=airflow
       logging:
           options:
               max-size: 10m
               max-file: "3"

   webserver:
       image: puckel/docker-airflow:1.10.9
       restart: always
       depends_on:
           - postgres
       environment:
           - LOAD_EX=n
           - EXECUTOR=Local
       logging:
           options:
               max-size: 10m
               max-file: "3"
       volumes:
           - ./dags:/usr/local/airflow/dags
           # - ./plugins:/usr/local/airflow/plugins
       ports:
           - "8080:8080"
       command: webserver
       healthcheck:
           test: ["CMD-SHELL", "[ -f /usr/local/airflow/airflow-webserver.pid ]"]
           interval: 30s
           timeout: 30s
           retries: 3

Т.е. раз тут нет build, то Dockerfile не запускается, а просто берутся два готовых образа из докер-хаба? Тогда не понимаю, зачем на гитхабе в репозитории puckel/docker-airflow есть докер-файл? Пытался запустить его отдельно не вышло. Сейчас проблема в том, что при запуске текущего докер-компоуз, Airflow не находит библиотеки из requirements.txt.
подключите ваш файл requirements через volumes и все будет работать

volumes:
   - ./requirements.txt:/requirements.txt
источник

GB

Georgy Borodin in Airflow
Anton Illarionov
подключите ваш файл requirements через volumes и все будет работать

volumes:
   - ./requirements.txt:/requirements.txt
Ну это же вредный совет. Надо зависимости в образ собирать, а не при запуске устанавливать
источник

AI

Anton Illarionov in Airflow
в ридми у puckel так советуется
источник

AI

Anton Illarionov in Airflow
это может и неверно, но просто
а дальше да, изучать как рабоатет докер и вообще это уже не об airflow
источник

GB

Georgy Borodin in Airflow
Anton Illarionov
в ридми у puckel так советуется
Ну это прямая дорога в ад зависимостей.
Вообще уже давно пора использовать официальный образ

https://airflow.apache.org/docs/apache-airflow/1.10.14/production-deployment.html#extending-the-image
источник

SG

Sergey Gavrilov in Airflow
Georgy Borodin
Ну это прямая дорога в ад зависимостей.
Вообще уже давно пора использовать официальный образ

https://airflow.apache.org/docs/apache-airflow/1.10.14/production-deployment.html#extending-the-image
Оо, спасибо огромное!
источник

SM

Sergey Maslow in Airflow
Всем спасибо! Попробую официальный образ.
источник

GB

Georgy Borodin in Airflow
Sergey Maslow
Всем спасибо! Попробую официальный образ.
Если не принципиально быть на первой версии, то для второй уже есть готовый официально аппрувнутый компоуз

https://airflow.apache.org/docs/apache-airflow/2.0.1/docker-compose.yaml
источник

SM

Sergey Maslow in Airflow
Не принципиально, вторую даже лучше, его тогда и возьму
источник

OS

Oleg Semenov in Airflow
Добрый день коллеги, хотим в организации для шины данных использовать AirFlow но на этапе знакомства с инструментом столкнулись со следующими ограничениями у технологии, основная проблема - медленный запуск обработчиков, задержка от предыдущего запуска 5-10 секунд, то есть для онлайна и даже псевдоонлайн процессов использовать не получится, слишком медленно. Как думаете если возможность обойти данное ограничение или стоит посмотреть в сторону другого инструмента, если да то буду благодарен за наводку.
источник

マサ

マキシム サモイロフ... in Airflow
Смотрите другой. Airflow не дает гарантию на околонулевую latency, задержки шедулера это норма.
источник

OS

Oleg Semenov in Airflow
マキシム サモイロフ
Смотрите другой. Airflow не дает гарантию на околонулевую latency, задержки шедулера это норма.
Подскажите а случайно не сталкивались другими инструментами так как мне вроде кроме Apache NiFi вроде больше нечего в голову не приходит
источник

マサ

マキシム サモイロフ... in Airflow
К сожалению, не сталкивался, но чат тут может помочь
источник

OS

Oleg Semenov in Airflow
マキシム サモイロフ
К сожалению, не сталкивался, но чат тут может помочь
Спасибо, и правда может чат даст наводку =)
источник

SG

Sergey Gavrilov in Airflow
Oleg Semenov
Добрый день коллеги, хотим в организации для шины данных использовать AirFlow но на этапе знакомства с инструментом столкнулись со следующими ограничениями у технологии, основная проблема - медленный запуск обработчиков, задержка от предыдущего запуска 5-10 секунд, то есть для онлайна и даже псевдоонлайн процессов использовать не получится, слишком медленно. Как думаете если возможность обойти данное ограничение или стоит посмотреть в сторону другого инструмента, если да то буду благодарен за наводку.
А вы не думали взять какой-нибудь Спарк, как это все делают, и накрутить вокруг него нужный интерфейс? (почему интерфейс, потому что обычно ради него на Аерфлоу смотрят)
источник

ME

Max Efremov in Airflow
Oleg Semenov
Добрый день коллеги, хотим в организации для шины данных использовать AirFlow но на этапе знакомства с инструментом столкнулись со следующими ограничениями у технологии, основная проблема - медленный запуск обработчиков, задержка от предыдущего запуска 5-10 секунд, то есть для онлайна и даже псевдоонлайн процессов использовать не получится, слишком медленно. Как думаете если возможность обойти данное ограничение или стоит посмотреть в сторону другого инструмента, если да то буду благодарен за наводку.
Эм, airflow не для стриминга)
источник

ME

Max Efremov in Airflow
Nifi, streamsets, spark, flink, kafka streams - вот что для стримы)
источник

OS

Oleg Semenov in Airflow
Sergey Gavrilov
А вы не думали взять какой-нибудь Спарк, как это все делают, и накрутить вокруг него нужный интерфейс? (почему интерфейс, потому что обычно ради него на Аерфлоу смотрят)
Честно не копал в эту сторону, изначально искали уже относительно готовый продукт (в том числе и интерфейсом), но спасибо больше обязательно ознакомлюсь.
источник