Size: a a a

ClickHouse не тормозит

2020 August 13

DC

Denny Crane (I don't... in ClickHouse не тормозит
а я не заметил про joinGet, я про коррелированный подздапрос отвечал.

словари можно кешировать (и не грузить в память целиком), но вообще непоятно что вы делаете и почему вам нужен такой запрос что у вас в table2 ?
это таблица фактов или словарь(размерность)?  сколько там строк?
источник

A

Alex in ClickHouse не тормозит
и в основной таблице и во второстепенных - сотни миллионов строк. это попытка объединения нескольких "классических" таблиц в одну широкую
источник

DC

Denny Crane (I don't... in ClickHouse не тормозит
Alex
и в основной таблице и во второстепенных - сотни миллионов строк. это попытка объединения нескольких "классических" таблиц в одну широкую
это антипаттерн для КХ, не заработает, валите все в одну таблицу еще до КХ, на стадии ETL
источник

A

Alex in ClickHouse не тормозит
Denny Crane (I don't work at Yandex (never did))
это антипаттерн для КХ, не заработает, валите все в одну таблицу еще до КХ, на стадии ETL
сам я это понимаю, коллеги против. Спасибо Вам, буду биться дальше...
источник

DC

Denny Crane (I don't... in ClickHouse не тормозит
Alex
сам я это понимаю, коллеги против. Спасибо Вам, буду биться дальше...
так либо так либо никак, выбирать-то не из чего.
источник

G

Gleb in ClickHouse не тормозит
Denny Crane (I don't work at Yandex (never did))
так либо так либо никак, выбирать-то не из чего.
А потом большую таблицу саму с собой джойнить? Или как составлять отчёт, если в нем нужны данные из нескольких таблиц
источник

MK

Maxim Kniazkov in ClickHouse не тормозит
Здравствуйте! Задача: Сырые события занимают много места. Решаю так - предагрегирую запросом и сливаю в другую таблицу. Запрос на чтение не сразу видит данные, булкинсертом вставленные. Что-то делаю не так? Как правильно?
источник

MK

Maxim Kniazkov in ClickHouse не тормозит
И, забыл, из таблицы с сырыми данными делаю удаление событий, по которым была сделана агрегация
источник

DC

Denny Crane (I don't... in ClickHouse не тормозит
Gleb
А потом большую таблицу саму с собой джойнить? Или как составлять отчёт, если в нем нужны данные из нескольких таблиц
ммм, а зачем джойнить?

>, если в нем нужны данные из нескольких таблиц
валите все в одну таблицу (широкую ) еще до КХ, на стадии ETL
уже поджойненное как надо
источник

G

Gleb in ClickHouse не тормозит
Denny Crane (I don't work at Yandex (never did))
ммм, а зачем джойнить?

>, если в нем нужны данные из нескольких таблиц
валите все в одну таблицу (широкую ) еще до КХ, на стадии ETL
уже поджойненное как надо
Ясно, пока непонятно как там в etl джойнить)
источник

DC

Denny Crane (I don't... in ClickHouse не тормозит
Gleb
Ясно, пока непонятно как там в etl джойнить)
ну как как, как все джойнят.
У всех в этом чатике одна и таже проблема, как обогатить ивенты, если часть атрибутов приезжает позже.
источник

D

Dasha in ClickHouse не тормозит
Если используется Spark или MR - стандартно в скрипте Scala/или HiveQL аггрегировать данные, и вперёд 🙂 Заливать результат в денормализованную таблицу в CH
источник

D

Dasha in ClickHouse не тормозит
Denny Crane (I don't work at Yandex (never did))
ну как как, как все джойнят.
У всех в этом чатике одна и таже проблема, как обогатить ивенты, если часть атрибутов приезжает позже.
Если позже - то либо пересчитывать за предшествующий день/несколько дней, либо ждать, пока все таблицы заполнятся
источник

S

Shadilan R16 MU Rost... in ClickHouse не тормозит
Выключи кльяну
источник

AZ

Alexander Zinoviev in ClickHouse не тормозит
Denny Crane (I don't work at Yandex (never did))
ну как как, как все джойнят.
У всех в этом чатике одна и таже проблема, как обогатить ивенты, если часть атрибутов приезжает позже.
Классно было бы это паттерн в какой-нибудь доке рассмотреть
источник

DC

Denny Crane (I don't... in ClickHouse не тормозит
Alexander Zinoviev
Классно было бы это паттерн в какой-нибудь доке рассмотреть
я это, канадский дба, без фантазии. Мне такое абсолютно неинтересно. Вот раид разломать, потом собрать, это ко мне.
источник

MK

Maxim Kniazkov in ClickHouse не тормозит
Maxim Kniazkov
Здравствуйте! Задача: Сырые события занимают много места. Решаю так - предагрегирую запросом и сливаю в другую таблицу. Запрос на чтение не сразу видит данные, булкинсертом вставленные. Что-то делаю не так? Как правильно?
А мой вопрос? Или он совсем за плинтусом?
источник

DC

Denny Crane (I don't... in ClickHouse не тормозит
Maxim Kniazkov
А мой вопрос? Или он совсем за плинтусом?
инсерт в таблицу с каким движком сырые данные заливает?
например есть Engine=Buffer который флашит данные в таблицу не сразу
вставка  в  Distributed асинхронная, есть флаг который это меняет и т.д.
источник

DC

Denny Crane (I don't... in ClickHouse не тормозит
>И, забыл, из таблицы с сырыми данными делаю удаление событий, по которым была сделана агрегация
это все можно сделать с помощью Materialized View над таблицей с движком Engine=Null даже
источник

MK

Maxim Kniazkov in ClickHouse не тормозит
Denny Crane (I don't work at Yandex (never did))
инсерт в таблицу с каким движком сырые данные заливает?
например есть Engine=Buffer который флашит данные в таблицу не сразу
вставка  в  Distributed асинхронная, есть флаг который это меняет и т.д.
ENGINE = MergeTree
источник