Size: a a a

ClickHouse не тормозит

2021 March 09

DT

Dmitry Titov in ClickHouse не тормозит
Sergey Dobrozhanskyi
доброй ночи, есть проблема, вижу в replication_queue много очередей с ошибкой
Not executing log entry for part 32-202103_459363_460555_763 because it is covered by part 32-202103_459363_460556_764 that is currently executing                   │ Code: 234, e.displayText() = DB::Exception: No active replica has part 32-202103_459363_460555_763 or covering part (version 19.7.3.9 (official build))          │
началось после того как две ноды упали, иеперь вижу постоянный гиг входящего трафика между нодами и зукипером
сделайте поиск по 32-202103_459363_460556_764 в replication_queue
источник

SD

Sergey Dobrozhanskyi in ClickHouse не тормозит
Dmitry Titov
сделайте поиск по 32-202103_459363_460556_764 в replication_queue
именно по ней там одна запись
источник

SD

Sergey Dobrozhanskyi in ClickHouse не тормозит
Dmitry Titov
сделайте поиск по 32-202103_459363_460556_764 в replication_queue
и она не двигается
источник

SD

Sergey Dobrozhanskyi in ClickHouse не тормозит
Row 1:
──────
create_time:     2021-03-06 01:34:02
table:           send_tracking_subject_last_delivered_replicated
postpone_reason:
last_exception:  Code: 234, e.displayText() = DB::Exception: No active replica has part 32-202103_459363_460556_764 or covering part (version 19.7.3.9 (official build))

1 rows in set. Elapsed: 0.003 sec.
источник

DT

Dmitry Titov in ClickHouse не тормозит
Sergey Dobrozhanskyi
Row 1:
──────
create_time:     2021-03-06 01:34:02
table:           send_tracking_subject_last_delivered_replicated
postpone_reason:
last_exception:  Code: 234, e.displayText() = DB::Exception: No active replica has part 32-202103_459363_460556_764 or covering part (version 19.7.3.9 (official build))

1 rows in set. Elapsed: 0.003 sec.
Можно выполнить
SYSTEM RESTART REPLICA DB_NAME.send_tracking_subject_last_delivered_replicated;
Тогда кх скипнет эту запись
источник

SD

Sergey Dobrozhanskyi in ClickHouse не тормозит
Dmitry Titov
Можно выполнить
SYSTEM RESTART REPLICA DB_NAME.send_tracking_subject_last_delivered_replicated;
Тогда кх скипнет эту запись
это на каждой реплике?
источник

DT

Dmitry Titov in ClickHouse не тормозит
а вообще по логам нод надо бы поискать парт
32-202103_459363_460556_764
32-202103_459363_460556_763
Куда они пропали
источник

SD

Sergey Dobrozhanskyi in ClickHouse не тормозит
Dmitry Titov
Можно выполнить
SYSTEM RESTART REPLICA DB_NAME.send_tracking_subject_last_delivered_replicated;
Тогда кх скипнет эту запись
:) SYSTEM RESTART REPLICA default.send_tracking_subject_last_delivered_replicated;

Syntax error: failed at position 16:

SYSTEM RESTART REPLICA default.send_tracking_subject_last_delivered_replicated;

Expected one of: SET query, USE query, OPTIMIZE query, OPTIMIZE TABLE, Query with output, SHOW PROCESSLIST query, SHOW PROCESSLIST, DESCRIBE, DESC, INSERT query, INSERT INTO, SELECT, DROP, DETACH, EXISTS, SHOW CREATE or DESCRIBE query, SHOW, CREATE, DROP query, EXISTS, ALTER query, ALTER TABLE, WITH, KILL QUERY query, KILL QUERY, SELECT query, RENAME query, RENAME TABLE, CREATE TABLE or ATTACH TABLE query, ATTACH, CHECK TABLE, SHOW TABLES|DATABASES query, SYSTEM query, Query, USE, SET
источник

SD

Sergey Dobrozhanskyi in ClickHouse не тормозит
Dmitry Titov
а вообще по логам нод надо бы поискать парт
32-202103_459363_460556_764
32-202103_459363_460556_763
Куда они пропали
там была авария в дц, поэтому могли пропасть и они скорее не критичны даже
источник

DT

Dmitry Titov in ClickHouse не тормозит
Sergey Dobrozhanskyi
:) SYSTEM RESTART REPLICA default.send_tracking_subject_last_delivered_replicated;

Syntax error: failed at position 16:

SYSTEM RESTART REPLICA default.send_tracking_subject_last_delivered_replicated;

Expected one of: SET query, USE query, OPTIMIZE query, OPTIMIZE TABLE, Query with output, SHOW PROCESSLIST query, SHOW PROCESSLIST, DESCRIBE, DESC, INSERT query, INSERT INTO, SELECT, DROP, DETACH, EXISTS, SHOW CREATE or DESCRIBE query, SHOW, CREATE, DROP query, EXISTS, ALTER query, ALTER TABLE, WITH, KILL QUERY query, KILL QUERY, SELECT query, RENAME query, RENAME TABLE, CREATE TABLE or ATTACH TABLE query, ATTACH, CHECK TABLE, SHOW TABLES|DATABASES query, SYSTEM query, Query, USE, SET
Похоже версия старая, хм

system restart replicas;
источник

SD

Sergey Dobrozhanskyi in ClickHouse не тормозит
Dmitry Titov
Похоже версия старая, хм

system restart replicas;
SYSTEM RESTART REPLICAS сделал, но как-то ничего не поменялось
источник

SD

Sergey Dobrozhanskyi in ClickHouse не тормозит
Dmitry Titov
Похоже версия старая, хм

system restart replicas;
все также Row 1:
──────
create_time:     2021-03-06 01:34:02
table:           send_tracking_subject_last_delivered_replicated
postpone_reason:
last_exception:  Code: 234, e.displayText() = DB::Exception: No active replica has part 32-202103_459363_460556_764 or covering part (version 19.7.3.9 (official build))

1 rows in set. Elapsed: 0.003 sec.
источник

SD

Sergey Dobrozhanskyi in ClickHouse не тормозит
в зукипере этих данных скорее всего и нет
источник

DT

Dmitry Titov in ClickHouse не тормозит
Sergey Dobrozhanskyi
все также Row 1:
──────
create_time:     2021-03-06 01:34:02
table:           send_tracking_subject_last_delivered_replicated
postpone_reason:
last_exception:  Code: 234, e.displayText() = DB::Exception: No active replica has part 32-202103_459363_460556_764 or covering part (version 19.7.3.9 (official build))

1 rows in set. Elapsed: 0.003 sec.
Кол-во записей в очереди не изменилось?
источник

SD

Sergey Dobrozhanskyi in ClickHouse не тормозит
Dmitry Titov
Кол-во записей в очереди не изменилось?
нет
источник

DT

Dmitry Titov in ClickHouse не тормозит
Ок,

Вставка идет в эту таблицу сейчас?
источник

SD

Sergey Dobrozhanskyi in ClickHouse не тормозит
нет
источник

DT

Dmitry Titov in ClickHouse не тормозит
источник

DT

Dmitry Titov in ClickHouse не тормозит
но в случае DETACH PARTITION & ATTACH PARTITION

Нужно выбрать реплику с полным набором партов и выполнять ATTACH только на одной реплике
источник

IS

Illia Slobozhanin in ClickHouse не тормозит
Dmitry Titov
а вообще по логам нод надо бы поискать парт
32-202103_459363_460556_764
32-202103_459363_460556_763
Куда они пропали
А такой вопрос. Кх может на одной реплике удалить данные про парт (физически удалить директорию в результате мержа e.g.) , а на второй через какое-то время? Или Layout всех партов гарантированно синхронизирован с помощью ЗК вплоть до файловой структуры? (При нормальной работе кластера) Или такое только в результате сбоя/рассинхрона и тд происходит?
источник