Size: a a a

ClickHouse не тормозит

2021 March 04

D

Denisio in ClickHouse не тормозит
надо какойнить faq завести уже  :)
источник

DP

Dorian Peregrim in ClickHouse не тормозит
Нашел это решение в исшуях, спасибо. Жаль, что только руками
источник

DC

Denny Crane [not a Y... in ClickHouse не тормозит
Dorian Peregrim
Нашел это решение в исшуях, спасибо. Жаль, что только руками
Вы ссзб.
источник

DC

Denny Crane [not a Y... in ClickHouse не тормозит
Не нужно просто использовать этот список.
источник

DP

Dorian Peregrim in ClickHouse не тормозит
Согласен
источник

TM

Timur Mukhamet in ClickHouse не тормозит
Здравствуйте знатоки кликхаус. Подскажите пожалуйста какие нибудь драйвера на python. ClickHouse-driver пробовал, с map отказывается работать, ввод в nested ужасный, у меня много nested с вложенными массивами.
источник

E

Evgeniy in ClickHouse не тормозит
Ребят, а как сделать group by по 48 часов. Тип поля datetime
источник

DN

Dmitriy Novikov in ClickHouse не тормозит
Timur Mukhamet
Здравствуйте знатоки кликхаус. Подскажите пожалуйста какие нибудь драйвера на python. ClickHouse-driver пробовал, с map отказывается работать, ввод в nested ужасный, у меня много nested с вложенными массивами.
это единственный, есть еще http но там реквестом обычным
источник

TM

Timur Mukhamet in ClickHouse не тормозит
спасибо
источник

II

Igor Ivaniuk in ClickHouse не тормозит
Здравствуйте. Помогите пожалуйста.

Есть таблица:
CREATE TABLE IF NOT EXISTS user_logs
(
   user_id UInt64 CODEC(ZSTD),
   message String CODEC(ZSTD),
   ts DateTime CODEC(ZSTD)
) ENGINE = MergeTree()
ORDER BY (user_id, ts)
TTL ts + INTERVAL 1 MONTH DELETE
PARTITION BY toYYYYMMDD(ts)
SETTINGS index_granularity=8196


Делаю запрос:
SELECT * FROM user_logs order by ts desc limit 10


В результате идет сканирование всех партиций.
Как ускорит запрос? Ведь вринципе достаточно сканировать только посленюю партицию.
источник

D

Dj in ClickHouse не тормозит
Evgeniy
Ребят, а как сделать group by по 48 часов. Тип поля datetime
можно так:
select (toDate(0)+intDiv(toRelativeDayNum(dt),2)*2) as dt2daysrounded, sum(val) from (
select toStartOfDay(now())+(number*3600) dt, cityHash64(number)%10 val from numbers(100)
)
group by dt2daysrounded
источник

pk

papa karlo in ClickHouse не тормозит
Igor Ivaniuk
Здравствуйте. Помогите пожалуйста.

Есть таблица:
CREATE TABLE IF NOT EXISTS user_logs
(
   user_id UInt64 CODEC(ZSTD),
   message String CODEC(ZSTD),
   ts DateTime CODEC(ZSTD)
) ENGINE = MergeTree()
ORDER BY (user_id, ts)
TTL ts + INTERVAL 1 MONTH DELETE
PARTITION BY toYYYYMMDD(ts)
SETTINGS index_granularity=8196


Делаю запрос:
SELECT * FROM user_logs order by ts desc limit 10


В результате идет сканирование всех партиций.
Как ускорит запрос? Ведь вринципе достаточно сканировать только посленюю партицию.
если достаточно, то делайте запрос в последнюю партицию
источник

II

Igor Ivaniuk in ClickHouse не тормозит
papa karlo
если достаточно, то делайте запрос в последнюю партицию
Это понятно, но если в последней партицые по каким то причинам не окажется достаточно данных, тогда прейдется ручками делеть полный запрос.
Думал может есть решение в самом КХ.
источник

D

Dj in ClickHouse не тормозит
Igor Ivaniuk
Это понятно, но если в последней партицые по каким то причинам не окажется достаточно данных, тогда прейдется ручками делеть полный запрос.
Думал может есть решение в самом КХ.
можете сходить в with system.parts.rows запросить, но если логика приложения под контролем, то проще сходить итеративно... вообще если так мало, делайте партишны крупнее
источник

A

Alexey in ClickHouse не тормозит
Столкнулся с аналогичной проблемой. Как вариант делать materialized view и тащить оттуда интересующие данные
источник

II

Igor Ivaniuk in ClickHouse не тормозит
Dj
можете сходить в with system.parts.rows запросить, но если логика приложения под контролем, то проще сходить итеративно... вообще если так мало, делайте партишны крупнее
Не мало, я условно.
100 rows in set. Elapsed: 84.951 sec. Processed 3.76 billion rows, 774.14 GB (44.28 million rows/s., 9.11 GB/s.)
источник

D

Dj in ClickHouse не тормозит
Igor Ivaniuk
Не мало, я условно.
100 rows in set. Elapsed: 84.951 sec. Processed 3.76 billion rows, 774.14 GB (44.28 million rows/s., 9.11 GB/s.)
ну замените содержимое with тем что вам нужно
https://t.me/clickhouse_ru/165729
источник

DC

Denny Crane [not a Y... in ClickHouse не тормозит
Igor Ivaniuk
Здравствуйте. Помогите пожалуйста.

Есть таблица:
CREATE TABLE IF NOT EXISTS user_logs
(
   user_id UInt64 CODEC(ZSTD),
   message String CODEC(ZSTD),
   ts DateTime CODEC(ZSTD)
) ENGINE = MergeTree()
ORDER BY (user_id, ts)
TTL ts + INTERVAL 1 MONTH DELETE
PARTITION BY toYYYYMMDD(ts)
SETTINGS index_granularity=8196


Делаю запрос:
SELECT * FROM user_logs order by ts desc limit 10


В результате идет сканирование всех партиций.
Как ускорит запрос? Ведь вринципе достаточно сканировать только посленюю партицию.
Так нету такой оптимизации.
источник

AP

Al. P. in ClickHouse не тормозит
Хоть какие-то планы есть притащить в КХ оптимизатор (cascades и т.п.)?
источник

AP

Al. P. in ClickHouse не тормозит
Это эпический таск конечно, но тем не менее, вдруг.
источник