Телеграмм чат группы clickhouse

Ну дневные партиции это необычно, но допустим у вас трлн записей за 70 дней, так что возможно это оправдано.
Но ORDER BY и PARTITION BY сильно зависят от того, какие запросы вам нужны(с какой фильтрацией) и во вторую очередь от того, как компактно уложить можно данные

источник

16:04пожаловаться #13

DC

Denny Crane (I don't... in ClickHouse не тормозит

Sergey Mc

ну , запросы самые разные, от посчитать сумму по колонке и до невообразимых

а можете показать из кх клиента строку со статистикой когда вы считаете sum по колонке

источник

16:05пожаловаться #14

SM

Sergey Mc in ClickHouse не тормозит

Denny Crane (I don't work at Yandex (never did))

а можете показать из кх клиента строку со статистикой когда вы считаете sum по колонке

я бобром пользуюсь к клиенту нет доступа

источник

16:06пожаловаться #15

DC

Denny Crane (I don't... in ClickHouse не тормозит

Sergey Mc

я бобром пользуюсь к клиенту нет доступа

¯\_(ツ)_/¯

источник

16:07пожаловаться #16

DT

Dmitry Titov in ClickHouse не тормозит

А так в воздух еще можно сказать, что если данные лежат строго по sharding key, то можно сказать не ходить на те шарды, где нужных данных быть не может.
Натравить кодеки(быстрее данные будут считываться с диска)
возможно для некоторых запросов подойдет SAMPLING

Но без запросов особо не помочь

источник

16:09пожаловаться #17

SM

Sergey Mc in ClickHouse не тормозит

Denny Crane (I don't work at Yandex (never did))

¯\_(ツ)_/¯

источник

16:10пожаловаться #18

SM

Sergey Mc in ClickHouse не тормозит

Dmitry Titov

А так в воздух еще можно сказать, что если данные лежат строго по sharding key, то можно сказать не ходить на те шарды, где нужных данных быть не может.
Натравить кодеки(быстрее данные будут считываться с диска)
возможно для некоторых запросов подойдет SAMPLING

Но без запросов особо не помочь

SAMPLING не подойдет, нужны более менее точные расчеты, данные по всему кластеру лежат, можно выделять партиции по суткам например, чтобы обращаться только к одной партиции?

источник

16:12пожаловаться #19

l

lnuynxa in ClickHouse не тормозит

Sergey Mc

SAMPLING не подойдет, нужны более менее точные расчеты, данные по всему кластеру лежат, можно выделять партиции по суткам например, чтобы обращаться только к одной партиции?

если ты будешь писать в WHERE условие по partition key сработает partition elimination и он пойдет глядеть только нужные партиции

источник

16:14пожаловаться #20