Size: a a a

ClickHouse не тормозит

2021 February 04

DC

Denny Crane [not a Y... in ClickHouse не тормозит
Slach
а он при этом ack посылает в очередь что обработал ДО INSERT или после?
и где он блок хранит? на диске?
я не смотрел, наверное как в кафке, ack после успеха инсерта, блок в памяти, зачем на диске
источник

DC

Denny Crane [not a Y... in ClickHouse не тормозит
Grisha Egorov
Если я правильно понимаю, мне достаточно добавить к buffer таблице  уникальное поле например с uuid чтобы такого не случилось, а в репликатед таблице это поле не обязательно должно быть
все неправильно поняли. Дедупликация инсертов это вообще не про это, читайте доку про репликацию.
источник

DC

Denny Crane [not a Y... in ClickHouse не тормозит
кстати точно такую же дедупликацию вроде уже должны были присобачить в обычной mergetree, поищу
источник

DC

Denny Crane [not a Y... in ClickHouse не тормозит
о как, больше года раскопки https://github.com/ClickHouse/ClickHouse/pull/8467 , чудеса такая мелкая фича
источник

TU

Temur Uzbekov in ClickHouse не тормозит
всем привет
можно ли пересчитать данные в матвьюшке?
у нас есть матвьюшка, она хранит счетчики записей в основной таблице по минутам, но она стала как-то странно считать записи
после пересоздания все стало нормально

вот 2 запроса с агрегацией по часам - до и после пересоздания
версия 19.8.3.8

events_importance
┌─count─┬───────────────start─┐
│   194 │ 2021-02-02 06:00:00 │
│     7 │ 2021-02-02 04:00:00 │
└───────┴─────────────────────┘

events_importance после пересоздания
┌─count─┬───────────────start─┐
│   122 │ 2021-02-02 10:00:00 │
│    16 │ 2021-02-02 08:00:00 │
│    10 │ 2021-02-02 07:00:00 │
│    12 │ 2021-02-02 06:00:00 │
│    21 │ 2021-02-02 04:00:00 │
│     8 │ 2021-02-02 03:00:00 │
│     4 │ 2021-02-02 02:00:00 │
│     4 │ 2021-02-02 01:00:00 │
│     4 │ 2021-02-02 00:00:00 │
└───────┴─────────────────────┘

итоговое число записей одинаковое, но распределение совершенно разное
источник

TU

Temur Uzbekov in ClickHouse не тормозит
матвьюшка AggregatingMergeTree, основная таблица MergeTree
матвьюшка считается как

SELECT
   countState() AS count,
   toStartOfMinute(toDateTime(time)) AS time,
   importance,
   toDate(time) AS _date
FROM events
GROUP BY time, importance
источник

MP

Mikle Prist in ClickHouse не тормозит
Brahma Kumaris
Используйте политики хранения
Спасибо
источник

❌ Constantine ❌ in ClickHouse не тормозит
добрый вечер. сервер КХ был перезапущен. штатно.таблица реплицируемая. сейчас сервер не запускается с ошибкой DB::Exception: Suspiciously many (152) broken parts to remove.: Cannot attach table. правильно я понимаю, что я могу эти куски <Warning> DB.TABLE: Detaching stale part /var/lib/clickhouse/data/DB/TABLE/610766fc0a3e72b7376196f9f9251b7a_1024111_1024332_7_1024651, which should have been deleted after a move. That can only happen after unclean restart of ClickHouse after move of a part having an operation blocking that stale copy of part. перетащить в другую папку?
источник

SP

Sergey Platonov in ClickHouse не тормозит
Добрый вечер! нет ли в КХ готовых конструкций для 7 day rolling average?
источник

SP

Sergey Platonov in ClickHouse не тормозит
тапа avg(value)
   over (order by date asc
         rows between 6 preceding and current row) as avg,
источник

СГ

Сергей Гришанович... in ClickHouse не тормозит
/stat@combot
источник

C

Combot in ClickHouse не тормозит
Total messages: 202692
источник

AP

Alexander Petrov in ClickHouse не тормозит
Sergey Platonov
тапа avg(value)
   over (order by date asc
         rows between 6 preceding and current row) as avg,
Это всё ещё в разработке. https://github.com/ClickHouse/ClickHouse/issues/17623
источник

SP

Sergey Platonov in ClickHouse не тормозит
понятно, тогда через подзапросы
источник

RK

Rebrikov Konstantin in ClickHouse не тормозит
Этого не может быть, потому что не может быть никогда?! Но есть.

Здравствуйте! Столкнулся с воспроизводимой ситуацией, когда запросы через Distributed таблицу к system.settings  соседних серверов ClickHouse возвращают значение параметра(ов), которое когда-то на этом сервере было установлено, но с тех пор давно изменилось.
Как будто бы старое значение где-то залипло или закешировалось.
источник

RK

Rebrikov Konstantin in ClickHouse не тормозит
Подробнее.
Тестовый кластер из 3 серверов.
Над часто востребованными таблицами (system.merges, system.replication_queue и т.д.) из system у меня Distributed таблицы (самое простое - 3 шарда по штуке на сервер, без реплицирования), чтобы из любой точки стенда одним запросом получить полную картину.

Разбирался с причинами неких неполадок с межсерверным взаимодействием (в логах непрерывным спам много раз в секунду события <Trace> HTTPCommon: Failed communicating with {ANOTHER_HOST} with error 'connect timed out: {IP}.61:9009' will try to reconnect session .  на стенд идёт фоновая нагрузка примерно 100-200 тыс. событий в секунду).

Предположил, что надо покрутить параметры http_%_timeout, в частности значительно увеличить http_connection_timeout. (Поиск по этой группе показал, что некоторые его c 1 и до 15 поднимали).

На одном из серверов сперва установил (в конфиге профиля default-пользователя) http_connection_timeout в 10, потом в 2, потом закомментировал, тем самым восстановив значение по умолчанию - 1.
И локальный запрос этого параметра подтверждает, что значение параметра теперь дефолтное.
источник

RK

Rebrikov Konstantin in ClickHouse не тормозит
источник

RK

Rebrikov Konstantin in ClickHouse не тормозит
Но с соседних серверов запрос через Distributed таблицу возвращает давно не актуальное состояние, которое было час назад! (Точнее какое-то время неверное значение возвращалось при запросе с обоих соседних серверов, сейчас уже только с одного).
источник

RK

Rebrikov Konstantin in ClickHouse не тормозит
источник

DC

Denny Crane [not a Y... in ClickHouse не тормозит
Rebrikov Konstantin
Подробнее.
Тестовый кластер из 3 серверов.
Над часто востребованными таблицами (system.merges, system.replication_queue и т.д.) из system у меня Distributed таблицы (самое простое - 3 шарда по штуке на сервер, без реплицирования), чтобы из любой точки стенда одним запросом получить полную картину.

Разбирался с причинами неких неполадок с межсерверным взаимодействием (в логах непрерывным спам много раз в секунду события <Trace> HTTPCommon: Failed communicating with {ANOTHER_HOST} with error 'connect timed out: {IP}.61:9009' will try to reconnect session .  на стенд идёт фоновая нагрузка примерно 100-200 тыс. событий в секунду).

Предположил, что надо покрутить параметры http_%_timeout, в частности значительно увеличить http_connection_timeout. (Поиск по этой группе показал, что некоторые его c 1 и до 15 поднимали).

На одном из серверов сперва установил (в конфиге профиля default-пользователя) http_connection_timeout в 10, потом в 2, потом закомментировал, тем самым восстановив значение по умолчанию - 1.
И локальный запрос этого параметра подтверждает, что значение параметра теперь дефолтное.
это из-за pooling.

живой конект живет в пуле и выдается разным запросам, параметры у него такие какие были в момент его рождения.
источник