Size: a a a

ClickHouse не тормозит

2020 May 24

DT

Dmitry Titov in ClickHouse не тормозит
Mikhail Glader
и дропать её при перезапуске?
Ага
источник

MG

Mikhail Glader in ClickHouse не тормозит
костыльное, конечно, решение :) но спасибо за идею
источник

AK

Anton Khokhrin in ClickHouse не тормозит
Mikhail Glader
К сожалению, это немного не то. Мне надо перелить большую таблицу из хайва. Я запускаю копирование на множестве воркеров. Часть воркеров помирает и перезапускается кластером заново. Проблема в том, что до того, как погибнуть, воркеры успели что-то залить в клик. А клик не транзакционный, поэтому данные остаются. И когда воркер перезапускается и начинает лить заново, данные дублируются. Как раз этого я хочу избежать.
Если вставляются одни и те же блоки записей в одном и том же порядке, то должна работать дедупликация
источник

AT

Al T in ClickHouse не тормозит
ну так вам один раз перелить - один раз закостылил и забыл ))
источник

DR

Dmitry Rakitin in ClickHouse не тормозит
Всем привет, недавно стала возникать проблема - некоторые запросы блокируются и блокируют собой всю таблицу, висят в processlist бесконечно и ничего не происходит, нагрузки на сервере нет, kill query становится в очередь и ничего не стопает. Спасает только перезапуск. Подскажите в какую сторону копать?
источник

DT

Dmitry Titov in ClickHouse не тормозит
Anton Khokhrin
Если вставляются одни и те же блоки записей в одном и том же порядке, то должна работать дедупликация
Ну это нужно быть уверенным, что будут одинаковые блоки
источник

DT

Dmitry Titov in ClickHouse не тормозит
Но тоже хорошая идея
источник

AK

Anton Khokhrin in ClickHouse не тормозит
Хотя похоже, что это для replicated
источник

DT

Dmitry Titov in ClickHouse не тормозит
Да
источник

DT

Dmitry Titov in ClickHouse не тормозит
Но сделать репликатед таблицу не так сложно
источник

E

Eugene in ClickHouse не тормозит
Mikhail Glader
К сожалению, это немного не то. Мне надо перелить большую таблицу из хайва. Я запускаю копирование на множестве воркеров. Часть воркеров помирает и перезапускается кластером заново. Проблема в том, что до того, как погибнуть, воркеры успели что-то залить в клик. А клик не транзакционный, поэтому данные остаются. И когда воркер перезапускается и начинает лить заново, данные дублируются. Как раз этого я хочу избежать.
костыльно, но ты можешь заливать и периодически делать optimize table, чтобы схлопнуть дублирующиеся ключи.
Либо предоставить это самому движку - он будет этим заниматься в фоне, а дубликаты убирать на уровне запроса (вьюха какая-нибудь).
Но может это все неправильно - я всего месяц кликхаус мучаю. Возможно это антипаттерн :)
источник

DT

Dmitry Titov in ClickHouse не тормозит
Eugene
костыльно, но ты можешь заливать и периодически делать optimize table, чтобы схлопнуть дублирующиеся ключи.
Либо предоставить это самому движку - он будет этим заниматься в фоне, а дубликаты убирать на уровне запроса (вьюха какая-нибудь).
Но может это все неправильно - я всего месяц кликхаус мучаю. Возможно это антипаттерн :)
Как одноразовое действие вполне ок
источник

AT

Al T in ClickHouse не тормозит
Mikhail Glader
К сожалению, это немного не то. Мне надо перелить большую таблицу из хайва. Я запускаю копирование на множестве воркеров. Часть воркеров помирает и перезапускается кластером заново. Проблема в том, что до того, как погибнуть, воркеры успели что-то залить в клик. А клик не транзакционный, поэтому данные остаются. И когда воркер перезапускается и начинает лить заново, данные дублируются. Как раз этого я хочу избежать.
а как воркеры льют из хайва в клик? JDBC? и еще где сами данные лежат? HDFS?
источник

MG

Mikhail Glader in ClickHouse не тормозит
Al T
а как воркеры льют из хайва в клик? JDBC? и еще где сами данные лежат? HDFS?
да, все так.
источник

MG

Mikhail Glader in ClickHouse не тормозит
Al T
а как воркеры льют из хайва в клик? JDBC? и еще где сами данные лежат? HDFS?
Я пришел к тому, что выкачиваю паркеты из hdfs и лью кликхаус клиентом, но там сложности с распаковкой паркетов. Поэтому параллельно пробую jdbc.
источник

AT

Al T in ClickHouse не тормозит
Mikhail Glader
да, все так.
может еще попробовать через HDFS Engine лить из клика через insert into select ?
источник

MG

Mikhail Glader in ClickHouse не тормозит
Al T
может еще попробовать через HDFS Engine лить из клика через insert into select ?
Не очень понял, можешь поподробнее?
источник

AT

Al T in ClickHouse не тормозит
Mikhail Glader
Не очень понял, можешь поподробнее?
источник

AT

Al T in ClickHouse не тормозит
можно читать и писать в HDFS
источник

AT

Al T in ClickHouse не тормозит
и в таком случае просто делать insert into SELECT
источник