Size: a a a

ClickHouse не тормозит

2020 June 11

D

Dj in ClickHouse не тормозит
ну, на больших объемах вашей проблемы не будет. у вас будет большой парт с куче данных. как я сказал, можете удостовериться сделав OPTIMIZE после вставок.
источник

OB

Oleg Bukatchuk in ClickHouse не тормозит
Dj
ну, на больших объемах вашей проблемы не будет. у вас будет большой парт с куче данных. как я сказал, можете удостовериться сделав OPTIMIZE после вставок.
про OPTIMIZE я в курсе. Мне хочется, чтобы это делалось автоматом без лишних движений.
источник

D

Dj in ClickHouse не тормозит
Oleg Bukatchuk
про OPTIMIZE я в курсе. Мне хочется, чтобы это делалось автоматом без лишних движений.
оно делается автоматом без лишних движений... вставляете в течении дня, к концу дня у вас условно 2-3 парта,
ставите очистку раз в 4 часа, один из них почистится, потом другой, потом третий...
если хотите именно одним махом почистить все во всех таблицах - то вам лучше делать materialize ttl по расписанию.
источник

OB

Oleg Bukatchuk in ClickHouse не тормозит
Dj
раз в 10 минут запускается *один* мердж. если эти три строки в разных партах, они удалятся за 3 итерации.
можете сделать optimize после вставки в вашем примере, и тогда все 3 удалятся за раз.
поясниите логику
раз в 10 минут запускается *один* мердж. если эти три строки в разных партах, они удалятся за 3 итерации.
источник

D

Dj in ClickHouse не тормозит
Oleg Bukatchuk
поясниите логику
раз в 10 минут запускается *один* мердж. если эти три строки в разных партах, они удалятся за 3 итерации.
один раз в 10 минут (у вас таймаут в 600 выставлен),  ТТЛ-cleanup применяется к одному парту ( а может и нескольким, тут я не 100% уверен, но точно не всем)
источник

OD

Olga Daykhovskaya in ClickHouse не тормозит
Dj
ну, на больших объемах вашей проблемы не будет. у вас будет большой парт с куче данных. как я сказал, можете удостовериться сделав OPTIMIZE после вставок.
Проблема как раз была на больших объемах
Данные были партиционированы по дню, ttl стоял 3 дня
В итоге данные не чистились
источник

D

Dj in ClickHouse не тормозит
Olga Daykhovskaya
Проблема как раз была на больших объемах
Данные были партиционированы по дню, ttl стоял 3 дня
В итоге данные не чистились
Какой интервал был и сколько партов на день в среднем?
источник

AT

Anton T. in ClickHouse не тормозит
Добрый день. Есть вопрос по встроенной хэш функции sipHash64()

Я попробовал сгенерировать хэш используя библиотеку для Java http://www.forward.com.au/pfod/SipHashJavaLibrary/SipHashTests.java для одной и той же строки Мой код на Java и CH выдает разные результаты


На джава код такой:


SipHash_2_4 sipHash = new SipHash_2_4();
       long result = sipHash.hash(key, "abc".getBytes());
       System.out.print(result);
       assertTrue( true );


Выдает 6754548778392356773

CH же выдает при вызове

select sipHash64('abc')

результат
4596069200710135518


Подскажите пожалуйста в чем может быть причина?
источник

R

Rail in ClickHouse не тормозит
Скажите, какие есть хорошие практики для создания бэкапов?
источник

D

Dj in ClickHouse не тормозит
Rail
Скажите, какие есть хорошие практики для создания бэкапов?
меня могут закидать какашками - но на данный момент они все плохие )))
а вообще, это freeze для копирования данных и копирование контента папочек metadata ...
источник

R

Rail in ClickHouse не тормозит
Dj
меня могут закидать какашками - но на данный момент они все плохие )))
а вообще, это freeze для копирования данных и копирование контента папочек metadata ...
беда)
источник

D

Dj in ClickHouse не тормозит
Rail
беда)
если базу никто руками не дропнет, можно сделать доп реплики
источник

ЕА

Егор Андреевич... in ClickHouse не тормозит
подскажите, пожалуйста, можно как-то указать часовой пояс при http инсертах?
источник

R

Rail in ClickHouse не тормозит
Dj
если базу никто руками не дропнет, можно сделать доп реплики
а если использовать clickhouse-copier?
источник

D

Dj in ClickHouse не тормозит
Rail
а если использовать clickhouse-copier?
у всех есть плюсы и минусы... в зависимости от конкретного кейса что то будет лучше для вас, мы пока вообще по настоящему не бэкапим (
короче, я не пианист в этом пока, может ещё кто подскажет
источник

R

Rail in ClickHouse не тормозит
получаю в логах ошибку:
DB::Exception: Table structure in ZooKeeper is too different from local table structure

можете подсказать как обновить структуры таблиц в ZK?
источник

SS

Stepan Stepanov in ClickHouse не тормозит
Ребята, добрый день
Подскажите, в двух словах
у меня сервре КХ, хочу без даунтайма сделать «зеркало» на втором сервере, чтобы приложение читало от туда
это возможно быстро и без даунтайма и боли?
источник

DT

Dmitry Titov in ClickHouse не тормозит
Stepan Stepanov
Ребята, добрый день
Подскажите, в двух словах
у меня сервре КХ, хочу без даунтайма сделать «зеркало» на втором сервере, чтобы приложение читало от туда
это возможно быстро и без даунтайма и боли?
варианты:
через репликацию, но для этого на основном сервере таблицы должны реплицированные быть и нужен zookeeper. но это самый нормальный вариант

сделать на 1 первом сервере distributed таблицу которая смотрит только на второй сервер, сделать MV которая будет дублировать все вставки в эту distributed таблицу и отдельным INSERT SELECT вставить старые данные

использовать "репликацию" которая встроена в движок distributed таблиц, грубо говоря дублирует все вставки в обе таблицы

Два последних варианта особо не надежны, и часть данных может до 2 сервера не долететь
источник

SS

Stepan Stepanov in ClickHouse не тормозит
хм… спасибо за инфу и время!
источник

DT

Dmitry Titov in ClickHouse не тормозит
Rail
Скажите, какие есть хорошие практики для создания бэкапов?
хороших, подходящих для всех нет
но в доках описаны такие варианты
clickhouse-backup
специальная реплика+ snapshot fs
параллельный независимый пайплайн ETL
пользоватся яндекс.облаком там уже сделаны хорошие бекапы:)
источник