Size: a a a

ClickHouse не тормозит

2021 March 21

DC

Denny Crane [not a Y... in ClickHouse не тормозит
В видео митапа от 1октября или даже в прошлом апреле Алексей показывал
источник

MM

Michael M in ClickHouse не тормозит
я смотрю, что если поудалять данные в старых больших таблицах, то они тоже могут превратиться в компактные...
источник

MM

Michael M in ClickHouse не тормозит
Сделал сейчас
ALTER TABLE system.metric_log MODIFY TTL event_time + INTERVAL 1 HOUR;
ALTER TABLE system.trace_log MODIFY TTL event_time + INTERVAL 1 HOUR;
ALTER TABLE system.query_log MODIFY TTL event_time + INTERVAL 1 HOUR;
ALTER TABLE system.asynchronous_metric_log MODIFY TTL event_time + INTERVAL 1 HOUR;
ALTER TABLE system.query_thread_log MODIFY TTL event_time + INTERVAL 1 HOUR;

OPTIMIZE TABLE system.metric_log FINAL;
OPTIMIZE TABLE system.trace_log FINAL;
OPTIMIZE TABLE system.query_log FINAL;
OPTIMIZE TABLE system.asynchronous_metric_log FINAL;
OPTIMIZE TABLE system.query_thread_log FINAL;

и половина из таблиц стала иметь компактный формат.
источник

D

Dj in ClickHouse не тормозит
Michael M
Сделал сейчас
ALTER TABLE system.metric_log MODIFY TTL event_time + INTERVAL 1 HOUR;
ALTER TABLE system.trace_log MODIFY TTL event_time + INTERVAL 1 HOUR;
ALTER TABLE system.query_log MODIFY TTL event_time + INTERVAL 1 HOUR;
ALTER TABLE system.asynchronous_metric_log MODIFY TTL event_time + INTERVAL 1 HOUR;
ALTER TABLE system.query_thread_log MODIFY TTL event_time + INTERVAL 1 HOUR;

OPTIMIZE TABLE system.metric_log FINAL;
OPTIMIZE TABLE system.trace_log FINAL;
OPTIMIZE TABLE system.query_log FINAL;
OPTIMIZE TABLE system.asynchronous_metric_log FINAL;
OPTIMIZE TABLE system.query_thread_log FINAL;

и половина из таблиц стала иметь компактный формат.
формат определяется колвом строк-байт в созданном парте после мерджа/вставки
источник

SC

Sergey Churin in ClickHouse не тормозит
Michael M
Сделал сейчас
ALTER TABLE system.metric_log MODIFY TTL event_time + INTERVAL 1 HOUR;
ALTER TABLE system.trace_log MODIFY TTL event_time + INTERVAL 1 HOUR;
ALTER TABLE system.query_log MODIFY TTL event_time + INTERVAL 1 HOUR;
ALTER TABLE system.asynchronous_metric_log MODIFY TTL event_time + INTERVAL 1 HOUR;
ALTER TABLE system.query_thread_log MODIFY TTL event_time + INTERVAL 1 HOUR;

OPTIMIZE TABLE system.metric_log FINAL;
OPTIMIZE TABLE system.trace_log FINAL;
OPTIMIZE TABLE system.query_log FINAL;
OPTIMIZE TABLE system.asynchronous_metric_log FINAL;
OPTIMIZE TABLE system.query_thread_log FINAL;

и половина из таблиц стала иметь компактный формат.
вот тут про компактные куски: https://youtu.be/1LVJ_WcLgF8?t=10971
источник

MM

Michael M in ClickHouse не тормозит
Спасибо!
источник

DC

Denny Crane [not a Y... in ClickHouse не тормозит
Как раз мержи кажется не должны продьюсить комп. парты. Был такой pr
источник

MM

Michael M in ClickHouse не тормозит
кстати, может компактный формат будет быстрее на чтение, если выбираются все столбцы...
источник

MM

Michael M in ClickHouse не тормозит
а при index_granularity = 1 выходит построчный формат хранения данных.
источник

DC

Denny Crane [not a Y... in ClickHouse не тормозит
Michael M
а при index_granularity = 1 выходит построчный формат хранения данных.
В кх есть движок таблиц embeddedRocksdb его берите. Зачем извращения.
источник

MM

Michael M in ClickHouse не тормозит
Denny Crane [not a Yandex bot]
В кх есть движок таблиц embeddedRocksdb его берите. Зачем извращения.
не знал про него. почитаю сейчас. Спасибо!
источник

IG

Ilya Golshtein in ClickHouse не тормозит
Добрый вечер, как в CH можно [случайно] добиться дублирования данных? Вроде как можно вставлять данные через Distributed таблицу над Replicated c internal_replication false, да? Есть еще "популярные" способы?
источник

DT

Dmitry Titov in ClickHouse не тормозит
Ilya Golshtein
Добрый вечер, как в CH можно [случайно] добиться дублирования данных? Вроде как можно вставлять данные через Distributed таблицу над Replicated c internal_replication false, да? Есть еще "популярные" способы?
Nested Materialized View
источник

IG

Ilya Golshtein in ClickHouse не тормозит
Dmitry Titov
Nested Materialized View
Не гуглится. Это про nested структуры или про каскадирование?
источник

DT

Dmitry Titov in ClickHouse не тормозит
Ilya Golshtein
Не гуглится. Это про nested структуры или про каскадирование?
про каскадирование, а точнее даже ситуации когда несколько мв висят на одной таблице.
источник

IG

Ilya Golshtein in ClickHouse не тормозит
Да, это понятный вариант, спасибо.
Можно добиться дублирования странным описанием кластера и/или путями в ZK?
источник

DC

Denny Crane [not a Y... in ClickHouse не тормозит
Dmitry Titov
про каскадирование, а точнее даже ситуации когда несколько мв висят на одной таблице.
Это скорее про потерю а не про дубли
источник

DC

Denny Crane [not a Y... in ClickHouse не тормозит
Ilya Golshtein
Да, это понятный вариант, спасибо.
Можно добиться дублирования странным описанием кластера и/или путями в ZK?
Можно описать реплики как шарды и тогда distributed будет выдавать все по два
источник

DT

Dmitry Titov in ClickHouse не тормозит
Denny Crane [not a Yandex bot]
Это скорее про потерю а не про дубли
Хм, да
дубли будут в случае комбинации MV и кафки как источника,
тк потенциально блоки читаемые при ретрае из кафки могут менятся
источник

IG

Ilya Golshtein in ClickHouse не тормозит
Да, реплики как шарды понятно, спасибо.
источник