Size: a a a

2021 May 15

R

Roma Nikolaev in Airflow
источник

PA

Panchenko Andrey in Airflow
источник

PA

Panchenko Andrey in Airflow
Данных много?
источник

DV

Dmitry V. in Airflow
Данных немного, порядка 35-40 таблиц, по строкам до 600
UPD: часть таблиц представляют собой ID-Наименование (т.е. 2 столбца)
источник

PA

Panchenko Andrey in Airflow
Процедура разовая?
источник

DV

Dmitry V. in Airflow
Выполнять в идеале с периодичностью хотя бы в день
Если это сложная задача - можно было бы разбить на два дага с разными интервалами (день\месяц) для разных таблиц (оперативные данные раз в день, справочники раз в месяц)
источник

PA

Panchenko Andrey in Airflow
Как оркестратор согласен. Как инструмент нет.
источник

PA

Panchenko Andrey in Airflow
Это вы с прода дампите в аналитическую базу?
источник

PA

Panchenko Andrey in Airflow
Почему постгря?
источник

PA

Panchenko Andrey in Airflow
Могли бы сделать реплику на том же мускуле включить бинлог и у вас было бы ап ту дэйт
источник

DV

Dmitry V. in Airflow
Грубо говоря - да, база MySQL используется СервисДеском
Постгрес
- исторически сложилось, там уже хранятся данные из других источников
источник

DV

Dmitry V. in Airflow
Возвращаюсь с новостями
Действительно, библиотека Pandas решила задачу (read_sql + to_sql).
Спасибо всем неравнодушным! 🙇🏼‍♂️
источник

PA

Panchenko Andrey in Airflow
Это пока у вас так мало данных в табличках. А что будете делать когда у вас будут под сотню таблиц и гигабайты в каждой?
источник

DV

Dmitry V. in Airflow
Согласен, потребуется что-то более производительное
Если есть предложения, выслушаю 😁
Про реплику бд и бинлог увидел, но мне не знакома такая схема работы
источник

PA

Panchenko Andrey in Airflow
Так я ссылку скинул
источник

ME

Max Efremov in Airflow
Дамп в csv и загрузка из csv?)
источник

ME

Max Efremov in Airflow
А так, мб какой-то стриминг прикрутить новых записей
источник

PA

Panchenko Andrey in Airflow
Апаче Бим, или Флинк, Апаче Найфай
источник

ME

Max Efremov in Airflow
апаче спарк)
источник
2021 May 17

DA

Denis Asalhan in Airflow
Привет. Новый человек совсем в airflow посоветуйте курсы как автоматизировать пайплайны и на какую инфраструктуру, заранее спс.
источник