Телеграмм чат группы clickhouse

Max Khlystov in ClickHouse не тормозит

20:14пожаловаться #1

MK

а это безопасно при апгрейде версии не обновлять конфиг до версии пакета?

20:28пожаловаться #2

DT

Max Khlystov

при инсерте падает
2021.02.23 17:14:05.970043 [ 20184 ] {} <Error> StorageRabbitMQ (test): Producer's channel 32 error: connection lost
2021.02.23 17:14:05.970533 [ 20184 ] {} <Error> StorageRabbitMQ (test): Library error report: connection lost

но сообщение все равно публикуется

вы из кх вставляете в реббит?

Max Khlystov in ClickHouse не тормозит

20:29пожаловаться #3

MK

вы из кх вставляете в реббит?

да

20:29пожаловаться #4

DT

Max Khlystov

а это безопасно при апгрейде версии не обновлять конфиг до версии пакета?

Да, но обычно вообще советуем не трогать дефолтный конфига а просто писать все перегрузки сеттингов в /config.d

20:29пожаловаться #5

DT

Max Khlystov

да

Сложно сказать, пишите issue на гитхаб, пользователей реббит движка не очень много.

20:30пожаловаться #6

TM

Timur Mukhamet in ClickHouse не тормозит

Есть в кликхаус возможность спарсить json любой глубины вложенности. Сразу говорю, документацию смотрел, просто не хочется костыли писать.

Vasilij Abrosimov in ClickHouse не тормозит

21:34пожаловаться #7

VA

Timur Mukhamet

Есть в кликхаус возможность спарсить json любой глубины вложенности. Сразу говорю, документацию смотрел, просто не хочется костыли писать.

Так почитайте. Там короткий текст и есть несколько важных нюансов:
https://clickhouse.tech/docs/ru/sql-reference/functions/json-functions/

clickhouse.tech

JSON | Документация ClickHouse

Функции для работы с JSON В Яндекс.Метрике пользователями передаётся JSON в качестве параметров визитов. Для работы с та

21:37пожаловаться #8

TM

Timur Mukhamet in ClickHouse не тормозит

Вдоль и поперек прочитал, пришел к выводу, что нет. Проблема как раз в этих нюансах.

Vasilij Abrosimov in ClickHouse не тормозит

21:39пожаловаться #9

VA

Ну в общем оно там весьма ограничено, да. Если многомерный json с повторами имён - то увы, надо искать другой подход (парсить вне клика, например)

21:40пожаловаться #10

TM

Timur Mukhamet in ClickHouse не тормозит

Спасибо!

21:42пожаловаться #11

BB

Добрый вечер. Читаем данные из Кафки , пишем в *mergeTree таблицу . Как результат очень много активных кусков после инсерта, которые со временем (несколько минут) исчезают. Правильным ли подходом будет читать в buffer таблицу ? Смущает ее особенность, когда данные могут потеряться.

23:08пожаловаться #12

DT

Добрый вечер. Читаем данные из Кафки , пишем в *mergeTree таблицу . Как результат очень много активных кусков после инсерта, которые со временем (несколько минут) исчезают. Правильным ли подходом будет читать в buffer таблицу ? Смущает ее особенность, когда данные могут потеряться.

Очень много это сколько?
что с партиционированием, какой поток данных

23:09пожаловаться #13

BB

Очень много это сколько?
что с партиционированием, какой поток данных

5-10 тысяч, партиционирования по месяцам. Поток 10-20 мб/с ( сотни тысяч строк) , но читается батчами по 5к, если не ошибаюсь.

23:12пожаловаться #14

DT

5-10 тысяч, партиционирования по месяцам. Поток 10-20 мб/с ( сотни тысяч строк) , но читается батчами по 5к, если не ошибаюсь.

> , но читается батчами по 5к, если не ошибаюсь.

Это что то неправильное, какая версия кх?

23:13пожаловаться #15

BB

> , но читается батчами по 5к, если не ошибаюсь.

Это что то неправильное, какая версия кх?

Не совсем понял. Версия декабрьская 2020 или январская, точно не вспомню .

23:14пожаловаться #16

DT

Не совсем понял. Версия декабрьская 2020 или январская, точно не вспомню .

А какой размер партов который кх создает?

23:17пожаловаться #17

BB

А какой размер партов который кх создает?

К сожалению , такие подробности не имею возможности уточнить.

Pavel in ClickHouse не тормозит

23:19пожаловаться #18

2021 February 24

P

Добрый вечер. Читаем данные из Кафки , пишем в *mergeTree таблицу . Как результат очень много активных кусков после инсерта, которые со временем (несколько минут) исчезают. Правильным ли подходом будет читать в buffer таблицу ? Смущает ее особенность, когда данные могут потеряться.

Тоже прочитал про буфер-движок и подумал, что он на уровне кх реализует то, что у нас сейчас наша самописеая приложенька делает: читает кафку, раз в 10 сек скидывает батч по 5-20к записей в кх. Но почитав подробней про buffer, понял, что наше решение огонь))
Ну, а вообще 5-10 тыщ партов это овер дохуя

Mishanya in ClickHouse не тормозит

00:00пожаловаться #19

M

5-10 тысяч, партиционирования по месяцам. Поток 10-20 мб/с ( сотни тысяч строк) , но читается батчами по 5к, если не ошибаюсь.

настройке в кафка-движке что бы батчи были по 64к
дефолтный сеттинг слишком маленький