Size: a a a

ClickHouse не тормозит

2020 September 08

DC

Denny Crane [not a Y... in ClickHouse не тормозит
Andrew (backEnd)
Извините за поднятие старого поста, но правильно ли я понимаю, что столбец С не имеет смысл переносить в prewhere, если он не указан в order by a,b
как раз наоборот. В 99% случаев имеет смысл в prewhere переносить только колонки которые не входят в первичный индекс
источник

DC

Denny Crane [not a Y... in ClickHouse не тормозит
Andrew (backEnd)
или важнее вообще поле, указанное в PARTITION BY
прунинг работает еще раньше, до этого, для него без разницы where или prewhere
источник

A(

Andrew (backEnd) in ClickHouse не тормозит
окей, спасибо
источник

DC

Denny Crane [not a Y... in ClickHouse не тормозит
create table (a,b,c,d) order by a,b

select a,b,c,d from prewhere a=? and b=? and c=?

1. КХ используя индекс получает список засечек в которых a=? and b=?
2. Идет по этому списку и читает колонку c (файлы c.mrk -> c.bin) и находя c=? получает новый список марков
3. Идет по новому списку марков и читает колонки (a,b,c,d) и (выдает строки у которых a=? and b=? and c=?)

(2, 3) происходят одновременно, в стриме
источник

DC

Denny Crane [not a Y... in ClickHouse не тормозит
Если есть партиционирование например по toYYYYMM(c) , то на этапе 0  КХ просканирует список партов и возьмет из minmax_c.idx только те парты в которых c=? попадает в диапазон minmax_c.idx и на этапе 1 будет использоваться только эти парты.

КХ в момент селекта не знает про toYYYYMM
источник

YV

Yaroslav Verbin in ClickHouse не тормозит
Вечер добрый.
Кто-нибудь решал задачу аггрегации временных отрезков ?
key begin1  end1
key begin2  end2
key begin3  end3
проаггрегировать по пересекающимся  отрезкам
источник

DC

Denny Crane [not a Y... in ClickHouse не тормозит
Yaroslav Verbin
Вечер добрый.
Кто-нибудь решал задачу аггрегации временных отрезков ?
key begin1  end1
key begin2  end2
key begin3  end3
проаггрегировать по пересекающимся  отрезкам
я в питоне
источник

YV

Yaroslav Verbin in ClickHouse не тормозит
Да и я в гошке. А хотелось бы в кликхаусе.
источник

DC

Denny Crane [not a Y... in ClickHouse не тормозит
Yaroslav Verbin
Да и я в гошке. А хотелось бы в кликхаусе.
удачи
источник

YV

Yaroslav Verbin in ClickHouse не тормозит
без вариантов ?
источник

DC

Denny Crane [not a Y... in ClickHouse не тормозит
сложно сказать, может у вас короткие диапазоны и надо просто посчитать что-то простое, и про надо нагенерить все значения begin1 ...  end1, и сделать pivot и потом group by
источник

YV

Yaroslav Verbin in ClickHouse не тормозит
ну полагаем, что это просто отрезки на прямой, инты в качестве координат. условно
mykey1  1  5
mykey1  1  6
mykey1  5  7
mykey1  10  12

агрегируется в

mykey1  1  7
mykey1  10  12
Я просто даже механики подходящей не вижу в кликхаусе
источник

AP

Alexander Petrov in ClickHouse не тормозит
Yaroslav Verbin
ну полагаем, что это просто отрезки на прямой, инты в качестве координат. условно
mykey1  1  5
mykey1  1  6
mykey1  5  7
mykey1  10  12

агрегируется в

mykey1  1  7
mykey1  10  12
Я просто даже механики подходящей не вижу в кликхаусе
Массивы? 😜
источник

ОБ

Олег Б in ClickHouse не тормозит
Привет всем, подскажите для кликхауса какие процессоры лучше выбрать? тут встал вопрос что 2шт 2660v3 стоят сильно дешевле чем 1шт 7262\7351 или 4215R. Вообще хочется понять на чем акцент сделать. По обьемам на текущий момент мы не утилизируем  1шт 2660v3, который занят еще задачами, сейчас выделяем в отдельный сервер и планируется рост сильный.
источник

pk

papa karlo in ClickHouse не тормозит
а почему вы думаете что упретесь не в диск
источник

ОБ

Олег Б in ClickHouse не тормозит
papa karlo
а почему вы думаете что упретесь не в диск
Тесты делали, SSD дишманский тянул, а вот влияние канальности памяти, кол-ва процессоров сильно влияло, но тесты наши могут быть сильно предвзятыми, так как на ограниченном кол-ве оборудования и ограниченном кол-ве данных. В новый планирую U2 аля  P4510. Баз у нас 500GB в пожатом Планируется рост до 3000-4000 (но этого может и не наступить). В тестах получали разницу между 1 и 2мя процессорами +40%, а вот убийство канальности памяти давало 3х кратное падение
источник

AP

Alexander Petrov in ClickHouse не тормозит
Yaroslav Verbin
ну полагаем, что это просто отрезки на прямой, инты в качестве координат. условно
mykey1  1  5
mykey1  1  6
mykey1  5  7
mykey1  10  12

агрегируется в

mykey1  1  7
mykey1  10  12
Я просто даже механики подходящей не вижу в кликхаусе
Отбой отмена, один случай не учёл.
источник

ОБ

Олег Б in ClickHouse не тормозит
На данный момент склоняюсь к 2660v3, как сохранение однотипности существующего, но тут вопрос если рост будет крайне сильным в производительности то или amd новые или intel, но про amd знаю после окончания кеша все становится с ними весьма плохо, а нагрузка у нас может быть постоянной, аля 24;7 без передыха
источник

DC

Denny Crane [not a Y... in ClickHouse не тормозит
Олег Б
На данный момент склоняюсь к 2660v3, как сохранение однотипности существующего, но тут вопрос если рост будет крайне сильным в производительности то или amd новые или intel, но про amd знаю после окончания кеша все становится с ними весьма плохо, а нагрузка у нас может быть постоянной, аля 24;7 без передыха
никто вам не скажет ничего лучше чем ваши тесты. У меня есть запросы которые отлично параллелятся в КХ и занимают все cpu и есть запросы которые не параллелятся и занимают один cpu, я бы брал то что дешевле, меньше частота, больше ядер.
источник

ОБ

Олег Б in ClickHouse не тормозит
Denny Crane [not a Yandex bot]
никто вам не скажет ничего лучше чем ваши тесты. У меня есть запросы которые отлично параллелятся в КХ и занимают все cpu и есть запросы которые не параллелятся и занимают один cpu, я бы брал то что дешевле, меньше частота, больше ядер.
на 20-30% дешевле 2630v3 и ядер доохренения, но если AMD или новые интела сильно быстрее выйдут.... Это смущает, разница 5 лет
источник