Size: a a a

ClickHouse не тормозит

2020 July 08

M

Maxim Bogdanov in ClickHouse не тормозит
по идее вместо дефолтовых значений будет храниться битовая маска, которая должна быть намного легче
источник

DT

Dmitry Titov in ClickHouse не тормозит
Maxim Bogdanov
да тут ещё в размер упирается. Ведь Nullable экономит место, если значение колонки пустое? Исходя из доки и логики. У меня под 400 колонок, и в каждой записи может быть используется от силы 20-30 штук.
У nullable были проблемы с сжатием емнип
источник

M

Maxim Bogdanov in ClickHouse не тормозит
Интересно. Попробую и так и сяк забенчить
источник

SC

Smoked Cheese in ClickHouse не тормозит
а отсутствующие или повторяющиеся значения и так хорошо жмутся стандартными lz4/zstd
источник

DC

Denny Crane (I don't... in ClickHouse не тормозит
Maxim Bogdanov
да тут ещё в размер упирается. Ведь Nullable экономит место, если значение колонки пустое? Исходя из доки и логики. У меня под 400 колонок, и в каждой записи может быть используется от силы 20-30 штук.
Ровно наоборот
источник

DC

Denny Crane (I don't... in ClickHouse не тормозит
Dmitry Koreckiy
а на каких операциях это заметно?
На групбай по такому полю
источник

S

Slach in ClickHouse не тормозит
https://github.com/ClickHouse/ClickHouse/pull/11873
УРА =) EXPLAIN подвезли
источник

S

Saya' in ClickHouse не тормозит
Всем привет!
Подскажите пожалуйста есть ли в клике аналоги функции lag,lead? Ед что я нашла это neighbor. Однако функция работает только с числами как я понимаю. Кстати говоря с числами все таки она не сработала по непонятной причине. Я пытаюсь получить дату из предыдущей или следующей строки. Есть ли кто сталкивался с таким.Заранее спасибо!
источник

N

Nikolay in ClickHouse не тормозит
Ну в целом аналитических функций в КХ нет.
источник

S

Slach in ClickHouse не тормозит
Nikolay
Ну в целом аналитических функций в КХ нет.
если под "аналитическими функциями" имеется WINDOW функции, то да, пока нет
источник

S

Slach in ClickHouse не тормозит
Saya'
Всем привет!
Подскажите пожалуйста есть ли в клике аналоги функции lag,lead? Ед что я нашла это neighbor. Однако функция работает только с числами как я понимаю. Кстати говоря с числами все таки она не сработала по непонятной причине. Я пытаюсь получить дату из предыдущей или следующей строки. Есть ли кто сталкивался с таким.Заранее спасибо!
в основном это делается через функции работы  с массивами и функции высшего порядка и такжечерез groupArray и arrayJoin / ARRAY JOIN
но конкретных примеров не приведу, извините
источник

A

Anton Kovalenko in ClickHouse не тормозит
/stat
источник

C

Combot in ClickHouse не тормозит
Total messages: 170783
источник

s

serge in ClickHouse не тормозит
Всем привет!
У меня есть таблица ReplicatedCollapsingMergeTree(sign) в которой хранятся метаданные.
Хочу построить словарь над этими данными.
Какие пути есть?

Возможно ли создать MATERIALIZED VIEW с оператором argMax над таблицей ReplicatedReplacingMergeTree?
источник

DN

Dmitriy Novikov in ClickHouse не тормозит
Saya'
Всем привет!
Подскажите пожалуйста есть ли в клике аналоги функции lag,lead? Ед что я нашла это neighbor. Однако функция работает только с числами как я понимаю. Кстати говоря с числами все таки она не сработала по непонятной причине. Я пытаюсь получить дату из предыдущей или следующей строки. Есть ли кто сталкивался с таким.Заранее спасибо!
neighbor
источник

OG

Oleksiy Golovko in ClickHouse не тормозит
Добрый день! Хочу понять как работает OPTIMIZE TABLE с репликами. Правильно ли я понимаю, что если у меня сконфигурирован кластер (в cluster.xml`), в нем 10 шардов и в каждом 2 реплики, то `OPTIMIZE TABLE t FINAL DEDUPLICATE будет достаточно запустить на одной из реплик каждого шарда?
источник

S

Slach in ClickHouse не тормозит
serge
Всем привет!
У меня есть таблица ReplicatedCollapsingMergeTree(sign) в которой хранятся метаданные.
Хочу построить словарь над этими данными.
Какие пути есть?

Возможно ли создать MATERIALIZED VIEW с оператором argMax над таблицей ReplicatedReplacingMergeTree?
MATERIALIZED VIEW это триггер на вставку
это не перебор всей таблицы

мне кажется проще периодически выгружать в обычную MergeTree таблицу с argMax
и ее указать в качестве source для CREATE DICTIONARY
https://clickhouse.tech/docs/en/sql-reference/dictionaries/external-dictionaries/external-dicts-dict-sources/#dicts-external_dicts_dict_sources-clickhouse
источник

S

Slach in ClickHouse не тормозит
Oleksiy Golovko
Добрый день! Хочу понять как работает OPTIMIZE TABLE с репликами. Правильно ли я понимаю, что если у меня сконфигурирован кластер (в cluster.xml`), в нем 10 шардов и в каждом 2 реплики, то `OPTIMIZE TABLE t FINAL DEDUPLICATE будет достаточно запустить на одной из реплик каждого шарда?
да, достаточно, измененые куски попадут в очередь репликации если стоит internal_replication=True в remote_servers Для шарда, но вообще то OPTIMIZE TABLE не рекомендуется запускать часто
слишком много чтения
источник

S

Slach in ClickHouse не тормозит
Oleksiy Golovko
Добрый день! Хочу понять как работает OPTIMIZE TABLE с репликами. Правильно ли я понимаю, что если у меня сконфигурирован кластер (в cluster.xml`), в нем 10 шардов и в каждом 2 реплики, то `OPTIMIZE TABLE t FINAL DEDUPLICATE будет достаточно запустить на одной из реплик каждого шарда?
ну и таблицы должны быть Engine=*ReplicatedMergeTree()
источник

OG

Oleksiy Golovko in ClickHouse не тормозит
Slach
да, достаточно, измененые куски попадут в очередь репликации если стоит internal_replication=True в remote_servers Для шарда, но вообще то OPTIMIZE TABLE не рекомендуется запускать часто
слишком много чтения
Спасибо! Но у меня сейчас похоже нет выбора. Либо OPTIMIZE TABLE либо SELECT … FROM t FINAL. Последний работает в 10 раз медленнее.
источник