Size: a a a

ClickHouse не тормозит

2021 February 09

D

Dj in ClickHouse не тормозит
Dmitry Lukovkin
Простите за глупый вопрос. В доках написано, что КХ использует сжатие. Если у нас дефолтные настройки, будет ли сжатие данных на диске?
<compression incl="clickhouse_compression">
   <case>
       <min_part_size>10000000000</min_part_size>
       <min_part_size_ratio>0.01</min_part_size_ratio>
       <method>zstd</method>
   </case>
</compression>
Вообще возможно как то "упаковать" данные на диске, чтобы они меньше места занимали?
Правильный order by +encoding иногда может зарешать. Надо знать данные
источник

DL

Dmitry Lukovkin in ClickHouse не тормозит
Dj
Правильный order by +encoding иногда может зарешать. Надо знать данные
там тупо логи лежат
источник

K

KiLEX 萊赫 in ClickHouse не тормозит
Dmitry Lukovkin
Простите за глупый вопрос. В доках написано, что КХ использует сжатие. Если у нас дефолтные настройки, будет ли сжатие данных на диске?
<compression incl="clickhouse_compression">
   <case>
       <min_part_size>10000000000</min_part_size>
       <min_part_size_ratio>0.01</min_part_size_ratio>
       <method>zstd</method>
   </case>
</compression>
Вообще возможно как то "упаковать" данные на диске, чтобы они меньше места занимали?
по умолчанию пакует LZ4
https://clickhouse.tech/docs/ru/sql-reference/statements/create/table/#codecs
вот тут можно почитать про кодаки сжатия, иногда можно ооооочень эффективно пожать поигравшись кодаками индивидуально для столбцов
источник

3

3ldar in ClickHouse не тормозит
Denis Stadnik
нет, я просто хочу понять как работает ASOF JOIN под капотом
источник

K

KiLEX 萊赫 in ClickHouse не тормозит
Dmitry Lukovkin
там тупо логи лежат
а эффективность текущего сжатия какая?
источник

D

Dj in ClickHouse не тормозит
Dmitry Lukovkin
там тупо логи лежат
Текстовые? Тогда только увеличить степень компрессии zstd
источник

DL

Dmitry Lukovkin in ClickHouse не тормозит
KiLEX 萊赫
а эффективность текущего сжатия какая?
как узнать?
источник

K

KiLEX 萊赫 in ClickHouse не тормозит
Dmitry Lukovkin
как узнать?
SELECT database, table, name, compression_codec,
round(sum(data_compressed_bytes) / 1024/1024/1024, 2) as size_gb,
round(sum(data_uncompressed_bytes) / 1024/1024/1024, 2) as size_uncompressed_gb,
round(size_gb/size_uncompressed_gb*100,2) perc
FROM system.columns

GROUP BY database,table, name, compression_codec
HAVING size_gb>0.1
ORDER BY name ASC,table ASC
источник

DL

Dmitry Lukovkin in ClickHouse не тормозит
Dj
Текстовые? Тогда только увеличить степень компрессии zstd
Можно уже к существующим таблицам менять кодек?
источник

K

KiLEX 萊赫 in ClickHouse не тормозит
Dmitry Lukovkin
Можно уже к существующим таблицам менять кодек?
можно к существующим полям
источник

S

Slach in ClickHouse не тормозит
Dmitry Lukovkin
Можно уже к существующим таблицам менять кодек?
ALTER TABLE.. MODIFY COLUMN
смотрите в доке
источник

DS

Denis Stadnik in ClickHouse не тормозит
сук, По факту не работает у меня вот так
источник

3

3ldar in ClickHouse не тормозит
Denis Stadnik
сук, По факту не работает у меня вот так
А все условия из доки выполнены?
источник

D

Dj in ClickHouse не тормозит
Dmitry Lukovkin
Можно уже к существующим таблицам менять кодек?
не помогут вам кодеки особо на лог-текстовых полях
источник

DL

Dmitry Lukovkin in ClickHouse не тормозит
KiLEX 萊赫
SELECT database, table, name, compression_codec,
round(sum(data_compressed_bytes) / 1024/1024/1024, 2) as size_gb,
round(sum(data_uncompressed_bytes) / 1024/1024/1024, 2) as size_uncompressed_gb,
round(size_gb/size_uncompressed_gb*100,2) perc
FROM system.columns

GROUP BY database,table, name, compression_codec
HAVING size_gb>0.1
ORDER BY name ASC,table ASC
Syntax error: failed at position 1 ('round'):
источник

K

KiLEX 萊赫 in ClickHouse не тормозит
Dj
не помогут вам кодеки особо на лог-текстовых полях
можно попробовать какой нить LZ4HC(9+), ну и логи бывают очень кардинальными )
источник

DS

Denis Stadnik in ClickHouse не тормозит
3ldar
А все условия из доки выполнены?
да. Соединяю по id пользователя и data в левой таблице должна быть меньше чем в правой
источник

K

KiLEX 萊赫 in ClickHouse не тормозит
Dmitry Lukovkin
Syntax error: failed at position 1 ('round'):
У меня точно такая же нога и она не болит)
источник

D

Dj in ClickHouse не тормозит
KiLEX 萊赫
можно попробовать какой нить LZ4HC(9+), ну и логи бывают очень кардинальными )
LZ4HC - это не кодек, это компрессия, и то лучше как я сказал zstd>10...  короче надо взять набор данных и делать бенчмарк
источник

K

KiLEX 萊赫 in ClickHouse не тормозит
Dj
LZ4HC - это не кодек, это компрессия, и то лучше как я сказал zstd>10...  короче надо взять набор данных и делать бенчмарк
ну да, в любом случае надо пробовать
источник