Size: a a a

ClickHouse не тормозит

2020 July 15

DC

Denny Crane (I don't... in ClickHouse не тормозит
(последнюю это в смысле последнюю вставленную, из номера парта вычислено будет)
источник

IF

Interference Farafon... in ClickHouse не тормозит
Denny Crane (I don't work at Yandex (never did))
доку не читатель?

https://clickhouse.tech/docs/ru/engines/table-engines/mergetree-family/graphitemergetree/
Версия метрики. Тип данных: любой числовой.

ClickHouse сохраняет строки с последней версией или последнюю записанную строку, если версии совпадают. Другие строки удаляются при слиянии кусков
Спасибо. Я обратила внимание на то, что у нас есть дубликаты, хотя по доке получается, что их не должно быть.
Вероятно, не было слияния в определенных партах.
источник

DC

Denny Crane (I don't... in ClickHouse не тормозит
Interference Farafonova
Спасибо. Я обратила внимание на то, что у нас есть дубликаты, хотя по доке получается, что их не должно быть.
Вероятно, не было слияния в определенных партах.
да слияния, и создатель движка предполагал что будут использоваться <function>any или max и тогда в запросах дубликаты не будут влиять на результат
источник

A

Alexey in ClickHouse не тормозит
Всем привет! А можно как-то загружать pandas dataframe в clickhouse?
источник

V

Vladimir in ClickHouse не тормозит
Привет! Можно ли как-то сказать clickhouse-у чтобы он больше ресурсов тратил на optimize table final?
источник

V

Vladimir in ClickHouse не тормозит
По партициям в aggregatingmergetree должно быть 100. После интенсивной вставки осталось ~2500 партов. Процесс optimise table final висит, но ресурсы особо не тратит. Сервер стоит ничего толком не делает. В логе мержи идут, но процессоры не заняты практически - пара ядер из 32-х
источник

Е

Екатерина in ClickHouse не тормозит
Alexey
Всем привет! А можно как-то загружать pandas dataframe в clickhouse?
источник

V

Vladimir in ClickHouse не тормозит
Как-то весь процесс встрял на optimize в итоге. Group by не влезает ни в какую память, а optimize как-то не торопится мержить
источник

DS

Dimitriy Scherbenko in ClickHouse не тормозит
Всем привет!
Подскажите, будет ли корректно работать вьюха, в которой таблица джойнится  на себя саму?

В таблице есть три уровня грануляции: дата, наименование события и id сессии. Для агрегации даты используется minState, событий -- CountState.

Таблица будет джойнится с агрегатом, где высчитывается дата начала сессии minMerge. Потом объединенная таблица агрегируется по названию события и дате начала сессии. Считается кол-во событий при помощи countMerge.

Или лучше все это грузить в array, группировать по сессиям, сортировать и выводить первое значение  в качестве даты начала сессии?
источник

D

Dj in ClickHouse не тормозит
Vladimir
По партициям в aggregatingmergetree должно быть 100. После интенсивной вставки осталось ~2500 партов. Процесс optimise table final висит, но ресурсы особо не тратит. Сервер стоит ничего толком не делает. В логе мержи идут, но процессоры не заняты практически - пара ядер из 32-х
background pool size увеличьте
источник

V

Vladimir in ClickHouse не тормозит
Dj
background pool size увеличьте
какие значения приемлемы? сервер 32 процессора 128 гб памяти
источник

D

Dj in ClickHouse не тормозит
Dimitriy Scherbenko
Всем привет!
Подскажите, будет ли корректно работать вьюха, в которой таблица джойнится  на себя саму?

В таблице есть три уровня грануляции: дата, наименование события и id сессии. Для агрегации даты используется minState, событий -- CountState.

Таблица будет джойнится с агрегатом, где высчитывается дата начала сессии minMerge. Потом объединенная таблица агрегируется по названию события и дате начала сессии. Считается кол-во событий при помощи countMerge.

Или лучше все это грузить в array, группировать по сессиям, сортировать и выводить первое значение  в качестве даты начала сессии?
неважно кто куда джойнится, но условия во вьюху не прокинуться вроде (хотя тут по чатику стоит поискать, может уже что-то сделано)
источник

D

Dj in ClickHouse не тормозит
Vladimir
какие значения приемлемы? сервер 32 процессора 128 гб памяти
если надо побыстрее все промерджить и можно забить на запросы, ставьте в 32 =) а вообще по умолчанию 16
источник

DS

Dimitriy Scherbenko in ClickHouse не тормозит
Dj
неважно кто куда джойнится, но условия во вьюху не прокинуться вроде (хотя тут по чатику стоит поискать, может уже что-то сделано)
Спасибо
источник

V

Vladimir in ClickHouse не тормозит
Dj
если надо побыстрее все промерджить и можно забить на запросы, ставьте в 32 =) а вообще по умолчанию 16
понял, спасибо
источник

D

Dj in ClickHouse не тормозит
Vladimir
какие значения приемлемы? сервер 32 процессора 128 гб памяти
вы сначала посмотрите в system.merges,может у вас система чем-то другим занята?
источник

V

Vladimir in ClickHouse не тормозит
Dj
вы сначала посмотрите в system.merges,может у вас система чем-то другим занята?
не, только эта таблица и есть
источник

D

Dj in ClickHouse не тормозит
ну, тогда ставьте в 32 если уверены что вы уперлись в СПУ... просто есть ненулевая вероятность что вы уперлись в диск
источник

V

Vladimir in ClickHouse не тормозит
Dj
ну, тогда ставьте в 32 если уверены что вы уперлись в СПУ... просто есть ненулевая вероятность что вы уперлись в диск
судя по мониторингам диск может сильно быстрее
источник

D

Dj in ClickHouse не тормозит
Ну ставьте 32 и вперед.
источник