Size: a a a

2018 January 24

P

Pavel in Airflow
Кого заинтересовал airflow для пайлайна в ML: AirBnB намутили автоматор ML, который в AF сам пайплайн выстраивает.
источник

ДС

Дина Сафина in Airflow
John Smith
Я понял..мне нужно много 3д принтеров
:-D
источник

AT

Andrey Terekhov in Airflow
Приду и установлю себе на виртуалку airflow - пусть живёт)
источник

YE

Yury Emelyanov in Airflow
Pavel
Кого заинтересовал airflow для пайлайна в ML: AirBnB намутили автоматор ML, который в AF сам пайплайн выстраивает.
Спасибо, это действительно интересно.
источник

SS

Sergey Sheremeta in Airflow
а разве ML Automator выложен в открытый доступ?
источник

P

Pavel in Airflow
Sergey Sheremeta
а разве ML Automator выложен в открытый доступ?
На сайте был вроде код + объяснение принципа.
источник

P

Pavel in Airflow
источник

SS

Sergey Sheremeta in Airflow
там лишь принцип
источник

P

Pavel in Airflow
Ну это как я понял был crowd-funded проект, так что может со временем выложат и в opensource, как те, кто фандил, наиграются
источник

P

Pavel in Airflow
А так можно и свой написать) с преферансом и куртизанками
источник

AY

Anton Yakunin in Airflow
Всем привет, как же не хватало такой группы)
Кто-нибудь разбирался как пометить таски success в еще ни разу не запущеном даге или в других версиях не выскакивает exception с отсутсвием start date? Используем 1.8.0
источник
2018 January 25

DA

Dmitry Antonov in Airflow
такой вопрос тем кто льет из Airflow в Clickhouse, вы свои хуки писали, а то я не встретил чего-то готового?
источник

ДС

Дина Сафина in Airflow
Мы писали свои операторы. Один — для транспортировки данных из хайва в стейджинговую область, второй — для перекладывания из стейджа в основную базу. Но у нас они не очень универсальны, заточены именно под наши данные.
источник

OI

Oleg Ilinsky in Airflow
там по сути выполняется в разных вариация что-то такое
clickhouse-client --host host --port <port> --user user -q "{query}"
даже без хуков
источник

OI

Oleg Ilinsky in Airflow
через subprocess
источник

OI

Oleg Ilinsky in Airflow
коннекшены хранятся в connections, подтягиваются через BaseHook
источник

OI

Oleg Ilinsky in Airflow
только не через get_conn (он в BaseHook бросает исключение NotImplementedError()), а с помощью статического get_connection
источник

YE

Yury Emelyanov in Airflow
Airflow здесь просто управляет потоком который качает подготовленные данные из hadf в ch
hadoop fs -cat | clickhouse-client --host host --port <port> --user user -q "{query}"
источник

SS

Sergey Sheremeta in Airflow
Дина Сафина
Мы писали свои операторы. Один — для транспортировки данных из хайва в стейджинговую область, второй — для перекладывания из стейджа в основную базу. Но у нас они не очень универсальны, заточены именно под наши данные.
Дина, а вы Airflow в докер заворачиваете или в virtualenv в хостовой ОС? и какая версия питона в docker/venv ?
источник

ДС

Дина Сафина in Airflow
Докеров у нас пока нет, мы virtualenv под Python2.7
источник