Size: a a a

ClickHouse не тормозит

2020 June 26

K

Kid in ClickHouse не тормозит
Alexander Petrov
Ответ ещё, наверное, зависит от того какие планы на результат запроса, может можно оптимальнее посчитать ответ на вопрос про который мы пока не знаем ни чего.
там дальше сложнее.
нужно найти только те строки, у которых свой евент, которые попадают в промежутки по времени между старт и конец и посчитать их, если там был новый евент.
источник

AP

Alexander Petrov in ClickHouse не тормозит
может это и проще
источник

AP

Alexander Petrov in ClickHouse не тормозит
источник

K

Kid in ClickHouse не тормозит
угу
источник

BB

Bral Bral in ClickHouse не тормозит
@den_crane сегодня, по Вашей наводке, увеличил pool_size , изменил max_bytes_to_merge_at_max_space_in_pool, max_bytes_to_merge_at_min_space_in_pool. Мерджи сразу пошли, количество кусков упало с 3000 -> 1700 меньше чем за час.
источник

BB

Bral Bral in ClickHouse не тормозит
Плюс , вдобавок , настроил по https://clickhouse.tech/docs/ru/operations/tips/#cpu-scaling-governor
источник

K

Kid in ClickHouse не тормозит
Alexander Petrov
Ответ ещё, наверное, зависит от того какие планы на результат запроса, может можно оптимальнее посчитать ответ на вопрос про который мы пока не знаем ни чего.
вот пример данных
И задача такая
если последовательн отсортировать данные по времени, и в промежутках между StartImage и ImageComplete есть event_name =‘Hint’, то считать эту строку, и далее также их считать.
Но дальше идет грязь в данных, например может не быть ImageComplete, а опять встретиться StartImage
источник

AP

Alexander Petrov in ClickHouse не тормозит
Kid
вот пример данных
И задача такая
если последовательн отсортировать данные по времени, и в промежутках между StartImage и ImageComplete есть event_name =‘Hint’, то считать эту строку, и далее также их считать.
Но дальше идет грязь в данных, например может не быть ImageComplete, а опять встретиться StartImage
О, game аналитиков подвезли 😜
источник

K

Kid in ClickHouse не тормозит
Alexander Petrov
О, game аналитиков подвезли 😜
я не гейм аналитик)
источник

K

Kid in ClickHouse не тормозит
увидел интересную задачку)
источник

AP

Alexander Petrov in ClickHouse не тормозит
а что значит то считать эту строку, и далее также их считать.? Считать все hint'ы от начала до конца или считать все строки после hint до конца или считать все ситуации когда между началом и концом есть hint?
источник

DC

Denny Crane (I don't... in ClickHouse не тормозит
Kid
вот пример данных
И задача такая
если последовательн отсортировать данные по времени, и в промежутках между StartImage и ImageComplete есть event_name =‘Hint’, то считать эту строку, и далее также их считать.
Но дальше идет грязь в данных, например может не быть ImageComplete, а опять встретиться StartImage
зависит конечно от кол-ва данных, можно посчитать в КХ все на массивах если на входе меньше скажем миллиарда строк, иначе надо готовить и чистить до КХ
источник

Y

Yan in ClickHouse не тормозит
добрый вечер!
вижу в логах постоянно сообщение
2020.06.26 19:59:11.897459 [ 10852 ] {} <Debug> DiskLocal: Reserving 1.00 MiB on disk `default`, having unreserved 164.52 GiB.

Не подскажите, это нормально?
источник

AP

Alexander Petrov in ClickHouse не тормозит
Судя по скрину,речь минимум про миллионы строк.
источник

DC

Denny Crane (I don't... in ClickHouse не тормозит
Yan
добрый вечер!
вижу в логах постоянно сообщение
2020.06.26 19:59:11.897459 [ 10852 ] {} <Debug> DiskLocal: Reserving 1.00 MiB on disk `default`, having unreserved 164.52 GiB.

Не подскажите, это нормально?
да, это просто сообщение что инсерт резервирует место под парт
Debug -- это отладочное сообщение
источник

AP

Alexander Petrov in ClickHouse не тормозит
Это какие-то AB тесты по тысячам пользователей пораждающим тысячи событий
источник

Y

Yan in ClickHouse не тормозит
Denny Crane (I don't work at Yandex (never did))
да, это просто сообщение что инсерт резервирует место под парт
Debug -- это отладочное сообщение
👍спасибо
источник
2020 June 27

K

Kid in ClickHouse не тормозит
Alexander Petrov
а что значит то считать эту строку, и далее также их считать.? Считать все hint'ы от начала до конца или считать все строки после hint до конца или считать все ситуации когда между началом и концом есть hint?
считать это count я имею ввиду
то есть count тех строк которые имеют евент хинт и он расположен между старт имейдж и имейдж комплит
источник

DT

Dmitry Titov in ClickHouse не тормозит
Kid
считать это count я имею ввиду
то есть count тех строк которые имеют евент хинт и он расположен между старт имейдж и имейдж комплит
но группировать то по каким признакам?
источник

DT

Dmitry Titov in ClickHouse не тормозит
по юзер айди?
А если на 1 юзер айди придет N периодов? start-end
источник