Size: a a a

ClickHouse не тормозит

2021 February 03

S

Slach in ClickHouse не тормозит
Ilshat Karazbaev
добрый день! А есть ли готовый мониторинг с аналитикой запросов в кликхаус, который метрики из query_log/query_thread_log сам заберет и разложит по полочкам, как сделано для постгреса в pgwatch2/powa4 или для MySQL в PMM?
пока такого нет
источник

S

Slach in ClickHouse не тормозит
Ilshat Karazbaev
добрый день! А есть ли готовый мониторинг с аналитикой запросов в кликхаус, который метрики из query_log/query_thread_log сам заберет и разложит по полочкам, как сделано для постгреса в pgwatch2/powa4 или для MySQL в PMM?
источник

IK

Ilshat Karazbaev in ClickHouse не тормозит
спасибо)
источник

IK

Ilshat Karazbaev in ClickHouse не тормозит
судя по названию, он только для кликхауса в кубернетисе?
источник

IK

Ivan Kizimenko in ClickHouse не тормозит
какая из функций поиска подстроки самая легкая для CPU, если это корректный вопрос.

Второй вопрос имеет ли значение длина строки ?
источник

IK

Ivan Kizimenko in ClickHouse не тормозит
И третий вопрос, если сделать колонку с Materialized, сложить туда Категории (строки) и уже по ним делать выборку, они будут просто короче и меньше различных вариантов, это ускорит запрос ?
источник

IK

Ivan Kizimenko in ClickHouse не тормозит
сейчас есть поиск подстроки в url для понимания что за категория страницы. И я думаю как это можно оптимиизровать
источник

K

KiLEX 萊赫 in ClickHouse не тормозит
я сделал материалку с регекспом которая нарезает урл - потом уже группировки и поиск получается не полнотекстовый. вышло весьма быстро
источник

S

Slach in ClickHouse не тормозит
Ilshat Karazbaev
судя по названию, он только для кликхауса в кубернетисе?
ну там можно взять JSON
и заменить
cluster('all-sharded',system.query_log)
на просто
system.query_log
или на
cluster('your_cluster_name_from_remote_servers_config_xml_section',system.query_log)

и можно без kubernetes использовать
только clickhouse-grafana плагин в grafana поставьте
источник

IK

Ilshat Karazbaev in ClickHouse не тормозит
Slach
ну там можно взять JSON
и заменить
cluster('all-sharded',system.query_log)
на просто
system.query_log
или на
cluster('your_cluster_name_from_remote_servers_config_xml_section',system.query_log)

и можно без kubernetes использовать
только clickhouse-grafana плагин в grafana поставьте
спасибо, попробую
источник

IK

Ivan Kizimenko in ClickHouse не тормозит
KiLEX 萊赫
я сделал материалку с регекспом которая нарезает урл - потом уже группировки и поиск получается не полнотекстовый. вышло весьма быстро
не совсем понял про нарезает, складываете в массив что ли?
источник

K

KiLEX 萊赫 in ClickHouse не тормозит
Ivan Kizimenko
не совсем понял про нарезает, складываете в массив что ли?
нет, беру первую часть урла и складываю в отдельное поле
ну типа
https://github.com/minio/minio/tree/master/docs/erasure/storage-class
раскладываю в колонки
minio minio tree master docs …
источник

K

KiLEX 萊赫 in ClickHouse не тормозит
в самом деле зависит от проекта, мне 2 полей хватает
источник

S

Slach in ClickHouse не тормозит
Ivan Kizimenko
какая из функций поиска подстроки самая легкая для CPU, если это корректный вопрос.

Второй вопрос имеет ли значение длина строки ?
ну на самом деле там под капотом ОЧЕНЬ много оптимизаций

если данные по system.parts распределены равномерно
тогда самый простой вариант это создать еще одну колонку у которой DEFAULT extract(URL, pattern) или extractURLParameter(URL, param_name)
источник

K

KiLEX 萊赫 in ClickHouse не тормозит
Ivan Kizimenko
не совсем понял про нарезает, складываете в массив что ли?
и еще урлы нормализую - переменные оттуда убираю. тоже индивидуально для проектов
источник

S

Slach in ClickHouse не тормозит
Ivan Kizimenko
не совсем понял про нарезает, складываете в массив что ли?
просто extract(URL, pattern)
источник

IK

Ivan Kizimenko in ClickHouse не тормозит
Спасибо, пойду тестировать
источник

DV

Dmitry Vasiliev in ClickHouse не тормозит
добавляю данные через http используя драйвер https://github.com/mailru/go-clickhouse:
Code: 164, Message: default: Cannot execute query in readonly mode. For queries over HTTP

подскажите что делать?
источник

G

GithubReleases in ClickHouse не тормозит
ClickHouse/ClickHouse tagged: v21.1.3.32-stable
Link: https://github.com/ClickHouse/ClickHouse/releases/tag/v21.1.3.32-stable
Release notes:
ClickHouse stable release v21.1.3.32-stable
источник

DV

Dmitry Vasiliev in ClickHouse не тормозит
Dmitry Vasiliev
добавляю данные через http используя драйвер https://github.com/mailru/go-clickhouse:
Code: 164, Message: default: Cannot execute query in readonly mode. For queries over HTTP

подскажите что делать?
query - ro, exec -rw в этом драйвере
источник