Size: a a a

ClickHouse не тормозит

2021 February 25

T

T in ClickHouse не тормозит
спасибо за ответ
источник

A

Assasin in ClickHouse не тормозит
Denny Crane [not a Yandex bot]
Issue=bug
Вот вы рассказали что по кругу один и тот мерж ну покажите пример с именами партов. Желательно куски кх лога где видно сообщения. Ddl таблицы
Ок, спасибо
источник

AB

Andrey Bychkov in ClickHouse не тормозит
Всем привет! Может кто подсказать, в таблице используется движок `ReplacingMergeTree`, но происходит удаление не только дубликатов, но и остальных записей, в чем может быть проблема?
источник

AZ

Anton Zhuravsky in ClickHouse не тормозит
Andrey Bychkov
Всем привет! Может кто подсказать, в таблице используется движок `ReplacingMergeTree`, но происходит удаление не только дубликатов, но и остальных записей, в чем может быть проблема?
очень рандомно, но проверьте, не задан ли TTL - я как-то час баг искал, а оказалось просто вставлял записи со старым временем слишком 🙂
источник

DC

Denny Crane [not a Y... in ClickHouse не тормозит
Timur Sabirov
всем привет, где то читал что много таблиц в кх это антипаттерн, киньте плиз ссылку на доку или обсуждение где это обьясняется
Не все так страшно, пока таблиц разумное количество и это зависит от дисков и cpu.
Проблема в том что есть оверхед на поддержание жизни replicated таблиц поэтому кх рекомендует макс 10000 replicated. И др. проблема это много партов. В 99% случаев 100 таблиц вместо одной это в 100 раз больше партов. Каждый парт это каталог  с файлами, это приыодит к разным проблемам типа медленный старт.
источник

TS

Timur Sabirov in ClickHouse не тормозит
Denny Crane [not a Yandex bot]
Не все так страшно, пока таблиц разумное количество и это зависит от дисков и cpu.
Проблема в том что есть оверхед на поддержание жизни replicated таблиц поэтому кх рекомендует макс 10000 replicated. И др. проблема это много партов. В 99% случаев 100 таблиц вместо одной это в 100 раз больше партов. Каждый парт это каталог  с файлами, это приыодит к разным проблемам типа медленный старт.
спасибо
источник

DC

Denny Crane [not a Y... in ClickHouse не тормозит
Andrey Bychkov
Всем привет! Может кто подсказать, в таблице используется движок `ReplacingMergeTree`, но происходит удаление не только дубликатов, но и остальных записей, в чем может быть проблема?
Удаление? Были видны записи в selecf а потом исчезли?
Удаляются дубликаты с одинаковыми значениями ключа orderby
источник

DC

Denny Crane [not a Y... in ClickHouse не тормозит
Viacheslav Nefedov
чего только Яндекс в кликхауз не добавил...
Кстати, половину добавил совсем не яндекс.
в последних релизах 46% фич добавили не в яндексе
источник

EP

Evgen Pr in ClickHouse не тормозит
Всем привет. подскажите плз, default_replica_path начиная с какой версии поддерживается и в какое место конфига его нужно добавлять?
источник

Д

Дмитрий in ClickHouse не тормозит
всем доброго времени суток. Подскажите, пожалуйста, как можно установить квоту по RAM для запросов определённого пользователя в Clickhouse?
источник

D

Dj in ClickHouse не тормозит
Дмитрий
всем доброго времени суток. Подскажите, пожалуйста, как можно установить квоту по RAM для запросов определённого пользователя в Clickhouse?
max_memory_usage
max_memory_usage_for_user
источник

Д

Дмитрий in ClickHouse не тормозит
Dj
max_memory_usage
max_memory_usage_for_user
спасибо
источник

S

Slach in ClickHouse не тормозит
Maxim Surkiz
Привет! Есть Кафка и кх который читает данные из топика. Иногда сообщения в топике не соответствуют формату таблицы в кх и соответственно не загружаются в клик. Хочется такие случаи выявлять.
Какие можете посоветовать инструменты для мониторинга, кроме очевидного грепанья логов или можно ли именно эти ошибки перенаправить в отдельный лог, что бы отделить от всего потока логов кх?
https://github.com/housepower/clickhouse_sinker
может вам вот это больше подойдет?
источник

VB

Vladimir Bunchuk in ClickHouse не тормозит
перешли с этой штуки на Kafka таблицы
более гибко работать с ними можно
источник

S

Slach in ClickHouse не тормозит
Vladimir Bunchuk
перешли с этой штуки на Kafka таблицы
более гибко работать с ними можно
ну да =) там просто кейс про то что kafka engine пока умеет делать только skip для сообщений не подходящих по формату
а хотелось бы их в отдельный какой то kafka topic складывать наверное
источник

VB

Vladimir Bunchuk in ClickHouse не тормозит
Slach
ну да =) там просто кейс про то что kafka engine пока умеет делать только skip для сообщений не подходящих по формату
а хотелось бы их в отдельный какой то kafka topic складывать наверное
А, понял. Это было бы полезно
источник

MS

Maxim Surkiz in ClickHouse не тормозит
Спасибо! Синкер ранее уже трогал, но для других целей, присмотрюсь к нему для этого кейса 👌
источник

PK

Petr Kozyrev in ClickHouse не тормозит
Всем привет! У меня такой пайплайн: Есть таблица MergeTree, в которую сыпятся данные по 5млн товаров несколько раз в день. Эта таблица не меняется, только дополняется. Для того, чтобы cэкономить место, данные по товарам (названия, категории, поставщики и пр.), я сохраняю в отдельную таблицу с движком Join. Это позволяет и экономить место и делать разные аггрегации. Однако, я хотел бы в таблице  Join менять только изменяющиеся данные, а не перезаливать 5млн товаров несколько раз в день (например, обновить только 100тыс товаров). Мне продолжать сидеть на Join или лучше смотреть в другие движки, например ReplacingMergeTree (которые удаляет дубликаты, но не сразу)
источник

S

Slach in ClickHouse не тормозит
Maxim Surkiz
Спасибо! Синкер ранее уже трогал, но для других целей, присмотрюсь к нему для этого кейса 👌
не факт что подойдет
источник

DC

Denny Crane [not a Y... in ClickHouse не тормозит
Petr Kozyrev
Всем привет! У меня такой пайплайн: Есть таблица MergeTree, в которую сыпятся данные по 5млн товаров несколько раз в день. Эта таблица не меняется, только дополняется. Для того, чтобы cэкономить место, данные по товарам (названия, категории, поставщики и пр.), я сохраняю в отдельную таблицу с движком Join. Это позволяет и экономить место и делать разные аггрегации. Однако, я хотел бы в таблице  Join менять только изменяющиеся данные, а не перезаливать 5млн товаров несколько раз в день (например, обновить только 100тыс товаров). Мне продолжать сидеть на Join или лучше смотреть в другие движки, например ReplacingMergeTree (которые удаляет дубликаты, но не сразу)
попробуйте  EmbeddedRocksDB + словарь сверху
источник