Size: a a a

ClickHouse не тормозит

2020 June 24

DT

Dmitry Titov in ClickHouse не тормозит
Required Optional
я вот не уверен... where чаще работает быстрее чем IN
А сделайте запроса вида
select avg(cnt) from (SELECT count() as cnt FROM table GROUP BY date, commit,hashId,tid,gt)

или просто скажите, у вас для каждого набора hashId,tid,gt сколько строк выходит примерно?
источник

RO

Required Optional in ClickHouse не тормозит
Denny Crane (I don't work at Yandex (never did))
а order by какой у таблицы?
PARTITION BY (Date, commit) ORDER BY (gt, Book, tid) с 24 датами, 70 commit, 19 gt, 1019 Book и 5.2 милиона tid
источник

DC

Denny Crane (I don't... in ClickHouse не тормозит
Required Optional
PARTITION BY (Date, commit) ORDER BY (gt, Book, tid) с 24 датами, 70 commit, 19 gt, 1019 Book и 5.2 милиона tid
т.е. проблема в Book ? сколько их разных?

что показыает если выполнить запрос с force_primary_key ?
покажите статисктику из клиента

SELECT * FROM MyBigTable prewhere
MyBigTable.hashId=9051237127632764928 AND MyBigTable.tid='a2a6cb7d970bf333a50458fc2cfdfebe' AND MyBigTable.gt='first_value'
AND factor=1 AND Date='2020-06-04' AND commit = 6683359921796490297
источник

RO

Required Optional in ClickHouse не тормозит
Dmitry Titov
А сделайте запроса вида
select avg(cnt) from (SELECT count() as cnt FROM table GROUP BY date, commit,hashId,tid,gt)

или просто скажите, у вас для каждого набора hashId,tid,gt сколько строк выходит примерно?
┌──────────avg(cnt)─┐
│ 4582.805462172507 │
└───────────────────┘

1 rows in set. Elapsed: 171.514 sec. Processed 10.28 billion rows, 442.79 GB (59.91 million rows/s., 2.58 GB/s.)
источник

DT

Dmitry Titov in ClickHouse не тормозит
Required Optional
┌──────────avg(cnt)─┐
│ 4582.805462172507 │
└───────────────────┘

1 rows in set. Elapsed: 171.514 sec. Processed 10.28 billion rows, 442.79 GB (59.91 million rows/s., 2.58 GB/s.)
ну грубо говоря, кардинальность 8192 вам вприципе подходит
источник

RO

Required Optional in ClickHouse не тормозит
Denny Crane (I don't work at Yandex (never did))
т.е. проблема в Book ? сколько их разных?

что показыает если выполнить запрос с force_primary_key ?
покажите статисктику из клиента

SELECT * FROM MyBigTable prewhere
MyBigTable.hashId=9051237127632764928 AND MyBigTable.tid='a2a6cb7d970bf333a50458fc2cfdfebe' AND MyBigTable.gt='first_value'
AND factor=1 AND Date='2020-06-04' AND commit = 6683359921796490297
1 rows in set. Elapsed: 0.802 sec. Processed 5.59 million rows, 430.22 MB (6.97 million rows/s., 536.54 MB/s.)
источник

RO

Required Optional in ClickHouse не тормозит
Denny Crane (I don't work at Yandex (never did))
т.е. проблема в Book ? сколько их разных?

что показыает если выполнить запрос с force_primary_key ?
покажите статисктику из клиента

SELECT * FROM MyBigTable prewhere
MyBigTable.hashId=9051237127632764928 AND MyBigTable.tid='a2a6cb7d970bf333a50458fc2cfdfebe' AND MyBigTable.gt='first_value'
AND factor=1 AND Date='2020-06-04' AND commit = 6683359921796490297
только все вместе дают примерно 20с
источник

DC

Denny Crane (I don't... in ClickHouse не тормозит
Required Optional
только все вместе дают примерно 20с
wut?
источник

RO

Required Optional in ClickHouse не тормозит
20 секунд
источник

DC

Denny Crane (I don't... in ClickHouse не тормозит
Required Optional
20 секунд
3 вправо
источник

RO

Required Optional in ClickHouse не тормозит
полный запрос выдает 55 линий за 20 секунд. Не совсем понимаю комментарий "3 вправо"
источник

DC

Denny Crane (I don't... in ClickHouse не тормозит
Required Optional
1 rows in set. Elapsed: 0.802 sec. Processed 5.59 million rows, 430.22 MB (6.97 million rows/s., 536.54 MB/s.)
а какой book в этой строке и какая статистика будет если добавить в условие book =  ?
источник

DC

Denny Crane (I don't... in ClickHouse не тормозит
может вам book убрать из order by, он вам зачем там?
источник

RO

Required Optional in ClickHouse не тормозит
ну я могу добавить бук, но в этих запросах не используется... Сейчас
источник

RO

Required Optional in ClickHouse не тормозит
Denny Crane (I don't work at Yandex (never did))
а какой book в этой строке и какая статистика будет если добавить в условие book =  ?
оптимизация на другие запросы
источник

DC

Denny Crane (I don't... in ClickHouse не тормозит
Required Optional
ну я могу добавить бук, но в этих запросах не используется... Сейчас
я статистику хочу увидеть Processed 5.59 million rows при использованном book
источник

RO

Required Optional in ClickHouse не тормозит
Denny Crane (I don't work at Yandex (never did))
я статистику хочу увидеть Processed 5.59 million rows при использованном book
Это магия!
55 rows in set. Elapsed: 1.125 sec. Processed 819.20 thousand rows, 1.00 GB (728.27 thousand rows/s., 890.92 MB/s.)
источник

RO

Required Optional in ClickHouse не тормозит
Короче ясно, что при первичном ключе он весь должен учавствовать в запросе... Пропуски стоят дорого...
источник

D

Dj in ClickHouse не тормозит
а чё так можно было... (бук просто взять и добавить) о_О
источник

DC

Denny Crane (I don't... in ClickHouse не тормозит
Required Optional
Короче ясно, что при первичном ключе он весь должен учавствовать в запросе... Пропуски стоят дорого...
Ну это как бы везде одинаково, я узнал это 30 лет назад
источник