Телеграмм чат группы clickhouse

так то это MergeTree таблица обычная
https://clickhouse.tech/docs/en/operations/system-tables/query_thread_log/
может флашнуться на диск не успела
диски у вас сильно загружены?

clickhouse.tech

system.query_thread_log | ClickHouse Documentation

system.query_thread_log Contains information about threads which execute queries, for example, thread name, thread start

источник

16:33пожаловаться #11

AR

Alexander Ryzhenko in ClickHouse не тормозит

Slach

а сколько у вас Query Per Seconds?

20-30. В основном инсерты

источник

16:36пожаловаться #12

PN

Pavel Nemirovsky in ClickHouse не тормозит

Добрый день,

Подскажите пожалуйста не могу понять что я не правильно делаю

У нас есть одна таблица которая replicated на 3-х серверах (идентичные копии) и есть таблица которая distributed которая смотрит на 3 эти сервера

Задачи получить Triple Read Gain, но я четко вижу что когда бежит запрос то читает clickhouse с одного сервера, а на двух других серверах ничего не происходит в этот момент, нет загрузки CPU, IO etc.

Что я упуская и по какому принципу вообще такой вид запрос может делать distributed computation of results ?

Заранее спасибо

Павел

# SCHEMA
CREATE TABLE fgi.articles_fts
(
keyword String,
internal_id String,
publish_date DateTime('UTC')
)
ENGINE = Distributed('cluster', 'fgi', 'articles_fts_data', rand())

# EXPLAIN
explain select count(*) from fgi.articles_fts;

EXPLAIN
SELECT count(*)
FROM fgi.articles_fts

┌─explain─────────────────────────────────┐
│ ReadFromStorage (Read from Distributed) │
└─────────────────────────────────────────┘

1 rows in set. Elapsed: 0.012 sec.

# CONF
<yandex>
<cluster>
<cluster>
<shard>
<internal_replication>true</internal_replication>
<replica>
<host>1.internal</host>
<port>9000</port>
</replica>
<replica>
<host>2.internal</host>
<port>9000</port>
</replica>
<replica>
<host>3.internal</host>
<port>9000</port>
</replica>
</shard>
</cluster>
</remote_servers>
</yandex>

источник

17:08пожаловаться #13

S

Slach in ClickHouse не тормозит

Alexander Ryzhenko

20-30. В основном инсерты

iostat -x 1
какую утилизацию полосы показывает?

источник

17:19пожаловаться #14

GN

Grigory Narizhnyy in ClickHouse не тормозит

2020.09.28 13:44:45.496187 [ 164 ] {} <Error> schema.tablename (ReplicatedMergeTreePartCheckThread): No replica has part covering all_294_294_0 and a merge is impossible: we didn't find smaller parts with either the same min block or the same max block.
2020.09.28 13:44:45.497060 [ 164 ] {} <Error> schema.tablename (ReplicatedMergeTreePartCheckThread): Part all_294_294_0 is lost forever.

источник

17:20пожаловаться #15

GN

Grigory Narizhnyy in ClickHouse не тормозит

Добрый день, подскажите что это за ошибка такая и как лечить

источник

17:21пожаловаться #16

СФ

Сергей Фесенко... in ClickHouse не тормозит

Pavel Nemirovsky

Добрый день,

Подскажите пожалуйста не могу понять что я не правильно делаю

У нас есть одна таблица которая replicated на 3-х серверах (идентичные копии) и есть таблица которая distributed которая смотрит на 3 эти сервера

Задачи получить Triple Read Gain, но я четко вижу что когда бежит запрос то читает clickhouse с одного сервера, а на двух других серверах ничего не происходит в этот момент, нет загрузки CPU, IO etc.

Что я упуская и по какому принципу вообще такой вид запрос может делать distributed computation of results ?

Заранее спасибо

Павел

# SCHEMA
CREATE TABLE fgi.articles_fts
(
keyword String,
internal_id String,
publish_date DateTime('UTC')
)
ENGINE = Distributed('cluster', 'fgi', 'articles_fts_data', rand())

# EXPLAIN
explain select count(*) from fgi.articles_fts;

EXPLAIN
SELECT count(*)
FROM fgi.articles_fts

┌─explain─────────────────────────────────┐
│ ReadFromStorage (Read from Distributed) │
└─────────────────────────────────────────┘

1 rows in set. Elapsed: 0.012 sec.

# CONF
<yandex>
<cluster>
<cluster>
<shard>
<internal_replication>true</internal_replication>
<replica>
<host>1.internal</host>
<port>9000</port>
</replica>
<replica>
<host>2.internal</host>
<port>9000</port>
</replica>
<replica>
<host>3.internal</host>
<port>9000</port>
</replica>
</shard>
</cluster>
</remote_servers>
</yandex>

Я могу ошибаться но разве distributed таблицы работают с replicated? Вроде как они предназначены для работы с шардированными таблицами.
И как мне тут недавно объясняли на обычном селекте даже с шардированными таблицами прироста скорости не будет.

источник

18:12пожаловаться #17

D

Dj in ClickHouse не тормозит

Сергей Фесенко

Я могу ошибаться но разве distributed таблицы работают с replicated? Вроде как они предназначены для работы с шардированными таблицами.
И как мне тут недавно объясняли на обычном селекте даже с шардированными таблицами прироста скорости не будет.

replicated могут быть и не быть шардированными. смотря с какой стороны смотреть

источник

18:21пожаловаться #18

СФ

Сергей Фесенко... in ClickHouse не тормозит

Dj

replicated могут быть и не быть шардированными. смотря с какой стороны смотреть

Это я понимаю что они могут быть не шардированными, просто тут вопрос, а разве distributed будет работать быстрее просто на нешардированных replicated таблицах?

источник

18:22пожаловаться #19

СФ

Сергей Фесенко... in ClickHouse не тормозит

Грубо говоря на такой конфигурации
<shard>
<replica></replica>
<replica></replica>
</shard>

источник

18:23пожаловаться #20