Size: a a a

2021 January 25

VS

Vladislav 👻 Shishkov... in Airflow
instantclient нужен же
источник

AS

Alexander Salkov in Airflow
И прописать его в нужные переменные в образе
источник

VS

Vladislav 👻 Shishkov... in Airflow
Что логично, в документации airflow даже был пункт про установку
источник

ИК

Илья Китов in Airflow
Так вот он установлен
источник

ИК

Илья Китов in Airflow
Почему то не видет library
источник

VS

Vladislav 👻 Shishkov... in Airflow
Все правильно, потому что надо после установки сделать env и симлинки
источник

ИК

Илья Китов in Airflow
Ну вот симлинк не делал
источник

ИК

Илья Китов in Airflow
ln -s который?
источник

ИК

Илья Китов in Airflow
Vladislav 👻 Shishkov
Все правильно, потому что надо после установки сделать env и симлинки
Спасибо
источник

ИК

Илья Китов in Airflow
Попробую завтра прописать
источник

VS

Vladislav 👻 Shishkov... in Airflow
источник
2021 January 26

C

Combot in Airflow
Добро пожаловать в самое дружелюбное комьюнити.
источник

IK

Ivan Kizimenko in Airflow
как можно  SELECT из  кликхауса сохранять сразу в сжатый файл.

Если через request тащить и передавать все заголовки и параметры то все равно файл обычный выходит.

Через python библиотеку clickhouse-driver чет не пойму как сразу в файл запихнуть
источник

IK

Ivan Kizimenko in Airflow
Удалось через  requests
источник

GB

Georgy Borodin in Airflow
Ivan Kizimenko
Удалось через  requests
stream=True?
источник

IK

Ivan Kizimenko in Airflow
источник

GB

Georgy Borodin in Airflow
Ну да. Ещё smart_open кстати могу посоветовать для создания гзипнутых файлов везде
источник

IK

Ivan Kizimenko in Airflow
почитаю, спасибо
источник

А

Анастасия in Airflow
Привет! Подскажите, в какую сторону искать:

У меня есть 28 таблиц, которые нужно переложить из Postgres в Hive. Самый простой для меня способ - это цикл в одном таске, но хотелось бы чтобы таски для каждой таблицы запускались параллельно

Основной вопрос в том, как сделать так, чтобы в случае добавления новой таблицы не приходилось прописывать новый таск, а просто генерить их на основе названий и атрибутного состава
источник

GB

Georgy Borodin in Airflow
Анастасия
Привет! Подскажите, в какую сторону искать:

У меня есть 28 таблиц, которые нужно переложить из Postgres в Hive. Самый простой для меня способ - это цикл в одном таске, но хотелось бы чтобы таски для каждой таблицы запускались параллельно

Основной вопрос в том, как сделать так, чтобы в случае добавления новой таблицы не приходилось прописывать новый таск, а просто генерить их на основе названий и атрибутного состава
Лучше всего генерить даги динамически, а не таски в них
источник