Size: a a a

ClickHouse не тормозит

2021 February 05

s

serge in ClickHouse не тормозит
Slach
ну и фильтровать соответсвенно
SELECT ... WHERE dictGetOrDefault('db.dict','attribute',tuple(your_field),0) = 0
источник

В

Влад in ClickHouse не тормозит
Всем привет!

Пытаюсь завести clickhouse-copier для миграции данных на новые ноды.

Блоки копирует но не получается приаттачить.
В логе clickhouse-copier такое:
DB::Exception: Transaction failed (Node exists): Op #4, path: /clickhouse/tables/<table>/v2/blocks/20201217_replace_from_33251BB87614C3254BD357CDDC66D8F0. (version 21.1.3.32 (official build))

Версия clickhouse 21.1.3.32.

Что интересно, когда он это писал, мониторил содержимое znode по пути /clickhouse/tables/<table>/v2/blocks. И не увидел, что там что-то появилось.

Может это известная проблема?
источник

EI

Egor Ivanko in ClickHouse не тормозит
Добрый день
Подскажите с запросом

Есть:
CREATE MATERIALIZED VIEW test_materialized_view
ENGINE = MergeTree
PARTITION BY a ORDER BY (a, b, c, d, e, f, g, h)

Где a, b - String
Всего строк ~500M
Разных значений a около 10
Разных значений b - 3

При этом долго выполняется запрос вида:
SELECT a, b
FROM test_materialized_view
GROUP BY a, b
ORDER BY a, b;


Можно ли ускорить такой запрос в подобной ситуации
источник

MM

Michael M in ClickHouse не тормозит
Привет.

я верно понимаю, что вместо UPDATE-ов можно делать INSERT-ы  в ReplacingMergeTree c версией больше предыдущей, а при SELECT-е выбирать строчку с максимальной версией и так получать результат последнего "апдейта"?
источник

M

Mishanya in ClickHouse не тормозит
Michael M
Привет.

я верно понимаю, что вместо UPDATE-ов можно делать INSERT-ы  в ReplacingMergeTree c версией больше предыдущей, а при SELECT-е выбирать строчку с максимальной версией и так получать результат последнего "апдейта"?
Да
источник

M

Munir in ClickHouse не тормозит
Egor Ivanko
Добрый день
Подскажите с запросом

Есть:
CREATE MATERIALIZED VIEW test_materialized_view
ENGINE = MergeTree
PARTITION BY a ORDER BY (a, b, c, d, e, f, g, h)

Где a, b - String
Всего строк ~500M
Разных значений a около 10
Разных значений b - 3

При этом долго выполняется запрос вида:
SELECT a, b
FROM test_materialized_view
GROUP BY a, b
ORDER BY a, b;


Можно ли ускорить такой запрос в подобной ситуации
Сделайте виртуальные целые поля (материализованное поле - хеш от строкового поля) , на них постройке таблицу и делайте группировку. Можете попробовать сначала без изменения структуры.
источник

S

Slach in ClickHouse не тормозит
SELECT database, name, formatReadableSize(bytes_allocated) FROM system.dictionaries

проверьте сначала после загрузки
источник

AC

Artem Chekunov in ClickHouse не тормозит
Привет
Кто может подсказать по структуре каталогов

/data/DATABASE/TABLE/???/COLUMNS
источник

MS

Maxim Surkiz in ClickHouse не тормозит
Привет! Есть кликхаус на нашем сервере с таблицей ~12M строк, хочу перелить данные в кх на Yandex.Cloud что бы покрутить их в DataLens. Подскажите, как это проще/правильнее сделать?
источник

S

Slach in ClickHouse не тормозит
Maxim Surkiz
Привет! Есть кликхаус на нашем сервере с таблицей ~12M строк, хочу перелить данные в кх на Yandex.Cloud что бы покрутить их в DataLens. Подскажите, как это проще/правильнее сделать?
clickhouse-client -h your_server -q "SELECT * FROM db.table FORMAT TSV" | clickhouse-client -h yandex_cloud_server -q "INSERT INTO db.table FORMAT TSV"
источник

n🐈

nikoinlove 🐈 in ClickHouse не тормозит
а можно также с древнего кх в новый перемахнуть?)
источник

S

Slach in ClickHouse не тормозит
nikoinlove 🐈
а можно также с древнего кх в новый перемахнуть?)
INSERT INTO db.table SELECT * FROM remote('old_server:9000',db.table)
источник

n🐈

nikoinlove 🐈 in ClickHouse не тормозит
да так небось точно сломается с разными версиями)
источник

MS

Maxim Surkiz in ClickHouse не тормозит
Slach
INSERT INTO db.table SELECT * FROM remote('old_server:9000',db.table)
спасибо! кажется, вариант с remote предпочтительнее?
источник

S

Slach in ClickHouse не тормозит
nikoinlove 🐈
да так небось точно сломается с разными версиями)
протокол совместимый
источник

S

Slach in ClickHouse не тормозит
Maxim Surkiz
спасибо! кажется, вариант с remote предпочтительнее?
если у вас доступ до вашего clickhouse сервера из yandex cloud есть
то в целом да

еще remoteSecure смотрите
источник

MS

Maxim Surkiz in ClickHouse не тормозит
ок, понял 👍
источник

VF

Vladislav Filippov in ClickHouse не тормозит
Привет. А если для distributed таблицы добавить буферную, проблем каких-то быть не должно при вставке через нее?
db.table_buffer 
ENGINE = Buffer('db', 'table', .. )

db.table
ENGINE = Distributed('{cluster}', 'db', 'table_replicated', ..)

db.table_replicated
ENGINE = ReplicatedMergeTree('{path}/{shard}/db/table_replicated', '{replica}')
источник

DC

Denny Crane [not a Y... in ClickHouse не тормозит
Vladislav Filippov
Привет. А если для distributed таблицы добавить буферную, проблем каких-то быть не должно при вставке через нее?
db.table_buffer 
ENGINE = Buffer('db', 'table', .. )

db.table
ENGINE = Distributed('{cluster}', 'db', 'table_replicated', ..)

db.table_replicated
ENGINE = ReplicatedMergeTree('{path}/{shard}/db/table_replicated', '{replica}')
так и задумано

ENGINE = Distributed('{cluster}', 'db', 'table_buffer', ..)
источник

VF

Vladislav Filippov in ClickHouse не тормозит
Denny Crane [not a Yandex bot]
так и задумано

ENGINE = Distributed('{cluster}', 'db', 'table_buffer', ..)
не, а если не перед replicated, а именно для distributed?
источник