Size: a a a

ClickHouse не тормозит

2020 September 03

М

Митя in ClickHouse не тормозит
спасибо!
источник

DC

Denny Crane [not a Y... in ClickHouse не тормозит
Sergei Iamskoi
видать не в этом дело, снова из 2003 сообщений только 1463 приехало. Настройки поставил, что бы по истечению 1 секунды сбрасывал в таблицу в независимости от кол-ва байт.
<kafka_topic40>
   <retry_backoff_ms>1000</retry_backoff_ms>
   <fetch_min_bytes>1000</fetch_min_bytes>
   <fetch_wait_max_ms>1000</fetch_wait_max_ms>
</kafka_topic40>
так а те 400 дошли?
источник

SI

Sergei Iamskoi in ClickHouse не тормозит
Неа. Сейчас с нуля пересоздал все контейнеры\базы\очереди - снова часть не доходит.
источник

DC

Denny Crane [not a Y... in ClickHouse не тормозит
Sergei Iamskoi
Неа. Сейчас с нуля пересоздал все контейнеры\базы\очереди - снова часть не доходит.
а они все парсятся успешно ? В логе КХ есть ошибки?
источник

SI

Sergei Iamskoi in ClickHouse не тормозит
Denny Crane [not a Yandex bot]
а они все парсятся успешно ? В логе КХ есть ошибки?
Ошибок нет. Включен дебаг режим, что бы все писало. Сообщения все однотипные отправляются: просто числа статичные.
источник

DC

Denny Crane [not a Y... in ClickHouse не тормозит
vladamir
Всем привет! Есть поле в таблице, по которому хотим группировать и  фильтровать по нему. Это поле - строка из 24 символа, есть ли большой смысл делать cityHash64() от этого поля и добавлять уже в индекс (ORDER BY) как раз хеш а не саму строку? Будет ли фильтрация или группировка быстрее по хешу?
не будет, там это под капотом уже сделано
источник

DC

Denny Crane [not a Y... in ClickHouse не тормозит
Sergei Iamskoi
Ошибок нет. Включен дебаг режим, что бы все писало. Сообщения все однотипные отправляются: просто числа статичные.
Materialized view есть и вы в его таблицу смотрите, не в kafka engine, правильно?
ну пошлите 3млн. , сколько доедет?
источник

SI

Sergei Iamskoi in ClickHouse не тормозит
Denny Crane [not a Yandex bot]
Materialized view есть и вы в его таблицу смотрите, не в kafka engine, правильно?
ну пошлите 3млн. , сколько доедет?
Через mat.view пишу в таблицу test_table из KafkaEngine.```CREATE MATERIALIZED VIEW protoconsumer ON CLUSTER widget_cluster TO test_db.test_table
AS (SELECT company_id, product_id, toDate(event_date), toDateTime(event_date) FROM test_db.protoqueue);
```
Сейчас попробую побольше закинуть
источник

DC

Denny Crane [not a Y... in ClickHouse не тормозит
Екатерина
здравствуйте, а подскажет ли мне кто-нибудь такое: вот, есть у нас реплицирующие таблицы и несколько реплик на каждый шард, а потом мы решили репликацию убрать, достаточно ли будет просто убрать реплики из конфига и перезапустить CH, реплицирующие таблицы будут также работать, просто уже каждая в единственном экземпляре, или будут проблемы?
вы решили убрать репликацию и зукипер?
или вы решили разделить кластер?
т.е. вам нужны данные в тех других репликах?

на других репликах надо сделать: drop table или drop database иначе основные реплики продолжат писать в зукипер в очередь репликации для выключенных реплик и позже либо зукипер взорвется если у вас старый КХ либо в любом случае придется чистить зукипер как-то (вручную или через system drop replica)
источник

Е

Екатерина in ClickHouse не тормозит
нет, просто, допустим мы в будущем решим отключить репликацию, но шарды должны работать как раньше
источник

DC

Denny Crane [not a Y... in ClickHouse не тормозит
Екатерина
нет, просто, допустим мы в будущем решим отключить репликацию, но шарды должны работать как раньше
слова понял, смысла не уловил

вот у вас 4 сервера - два шарда

s1 реплицируется в s3
s2 реплицируется в s4

вы хотите навсегда убрать репликацию, оставить s1 и s2 ?

тогда имеет смысл переделать таблицы в неReplicated -- тогда инсерты станут быстрее

ИЛИ ?
источник

Е

Екатерина in ClickHouse не тормозит
Denny Crane [not a Yandex bot]
слова понял, смысла не уловил

вот у вас 4 сервера - два шарда

s1 реплицируется в s3
s2 реплицируется в s4

вы хотите навсегда убрать репликацию, оставить s1 и s2 ?

тогда имеет смысл переделать таблицы в неReplicated -- тогда инсерты станут быстрее

ИЛИ ?
да, имено так, оставить s1  и s2 и больше ничег не переделывать, допустим скорость INSERT нас и так устроит и таблицы пусть так и останутся Replicated, простопо факту они уже не буду реплицироваться
источник

DC

Denny Crane [not a Y... in ClickHouse не тормозит
Екатерина
да, имено так, оставить s1  и s2 и больше ничег не переделывать, допустим скорость INSERT нас и так устроит и таблицы пусть так и останутся Replicated, простопо факту они уже не буду реплицироваться
тогда редактируете remote_servers на s1 и s2 и удаляете оттуда инфу про s3 и s4

на s3 и s4 делаете drop database
источник

Е

Екатерина in ClickHouse не тормозит
Denny Crane [not a Yandex bot]
тогда редактируете remote_servers на s1 и s2 и удаляете оттуда инфу про s3 и s4

на s3 и s4 делаете drop database
спасибо
источник

SI

Sergei Iamskoi in ClickHouse не тормозит
Denny Crane [not a Yandex bot]
Materialized view есть и вы в его таблицу смотрите, не в kafka engine, правильно?
ну пошлите 3млн. , сколько доедет?
3 млн очень на долго получается 🙂 Сейчас отправил 20000 из них доехало 14120. Второй раз 16072 пришло.
источник

DC

Denny Crane [not a Y... in ClickHouse не тормозит
Sergei Iamskoi
3 млн очень на долго получается 🙂 Сейчас отправил 20000 из них доехало 14120. Второй раз 16072 пришло.
долго? пара секунд должно быть, максимум 10.

протобаф у вас? потренируйтесь на строках (TSV) на сообщениях из одного поля строкового.
с протобаф там все сложно раньше было, надо было передавать длину протобафа, потому что можно было передать много строк в одном кафка-месадж, не знаю как сейчас
источник

D

Dj in ClickHouse не тормозит
Denny Crane [not a Yandex bot]
не работает move_to_prewhere. Надо prewhere руками задавать
вопрос, не работает именно овер дистрибютед, или в целом не работает на мердж-енджин?
источник

DC

Denny Crane [not a Y... in ClickHouse не тормозит
Dj
вопрос, не работает именно овер дистрибютед, или в целом не работает на мердж-енджин?
источник

SI

Sergei Iamskoi in ClickHouse не тормозит
Denny Crane [not a Yandex bot]
долго? пара секунд должно быть, максимум 10.

протобаф у вас? потренируйтесь на строках (TSV) на сообщениях из одного поля строкового.
с протобаф там все сложно раньше было, надо было передавать длину протобафа, потому что можно было передать много строк в одном кафка-месадж, не знаю как сейчас
Да, прото. 20 тысяч отправляются где-то с минуты 2. Может, докеры так медленно локально работают..  Длинну по прежнему надо отправлять, если она указана не корректно, то это видно по полученным данным - они дефолтными значениями заполняются. Сейчас json попробую, но вроде с ним такая же проблема была. Вообще могу все это в виде репы с docker выложить,  что бы можно было посмотреть
источник

DC

Denny Crane [not a Y... in ClickHouse не тормозит
Sergei Iamskoi
Да, прото. 20 тысяч отправляются где-то с минуты 2. Может, докеры так медленно локально работают..  Длинну по прежнему надо отправлять, если она указана не корректно, то это видно по полученным данным - они дефолтными значениями заполняются. Сейчас json попробую, но вроде с ним такая же проблема была. Вообще могу все это в виде репы с docker выложить,  что бы можно было посмотреть
консольным какфка продьюсером отправляейте строки
источник