Size: a a a

ClickHouse не тормозит

2020 August 31

DC

Denny Crane [not a Y... in ClickHouse не тормозит
Дмитрий
доброго всем времени суток, подскажите, пожалуйста, такой момент: есть задача, в которой в систему поступает поток очень большой событий, события разделяются на типы (их на текущий момент примерно 30), у событий есть общие параметры и есть некоторые уникальные атрибуты.
Как Вы считаете будет ли рациональным уникальную часть для каждого типа событий писать в json-документ, который хранить в поле данных тип String, а общие атрибуты хранить как поля соответствующих типов данных? В последствие подразумевается обработка уникальных атрибутов, сохранённых в json средствами самого Clickhouse.
да может быть рациональным. Учитывайте что запросы к json будут в 1000 раз медленее чем к нормальным атрибутам в полях
источник

Д

Дмитрий in ClickHouse не тормозит
Denny Crane [not a Yandex bot]
да может быть рациональным. Учитывайте что запросы к json будут в 1000 раз медленее чем к нормальным атрибутам в полях
ок, спасибо)
источник

DC

Denny Crane [not a Y... in ClickHouse не тормозит
Artem
допусти инсерт в таблицу создает один парт и он должен "откатиться" (видимо физически файл удалиться). В какой момент пайплайна стриггерится инсерт в MV ?
с MV все сложно их может быть много и они могут обрабатываться в параллель.
можно считать что это undefined -- может пройдет вставка в таблицу а может и нет
источник

DC

Denny Crane [not a Y... in ClickHouse не тормозит
т.к. есть дедупликация инсертов (у replicated) то инсерт надо просто повторять, но из-за MV опять же все сложно и надо специальным образом создавать MV и включать дедупликацию для MV
источник

A

Artem in ClickHouse не тормозит
повторять битый инсерт бесполезно ведь. Он не пройдет целиком как есть
источник

A

Artem in ClickHouse не тормозит
а тк считается чексумма , то и бить его по частям бесполезно
источник

A

Artem in ClickHouse не тормозит
ну только если это не проблемы с сетью, которые пропадут
источник

DC

Denny Crane [not a Y... in ClickHouse не тормозит
Artem
повторять битый инсерт бесполезно ведь. Он не пройдет целиком как есть
да, бесполезно. Значит ручная починка и разбирательство куда вставилось куда нет
источник

S

Slach in ClickHouse не тормозит
Алишер Фозилов
Через драйвер https://github.com/ClickHouse/clickhouse-go на го кто делал bulk insert? Можете прояснить, как это происходит вообще? он отправляет все данные в кликхауз, кликхауз буфферизует, а после Commit'а добавляет в таблицу?
драйвер формирует запрос по Native протоколу
и дальше фигачит буфферизировано стримингово через сокет данные в бинарном Native формате

перед закрытием сокета в native протоколе отсылается "конец записи"
потом закрывает сокет
клик на своей стороне парсит данные
стримингово
и пишет их в новые parts
источник

GR

Gubaydullin Ruslan in ClickHouse не тормозит
Dj
если все инсерты одним махом вставите, второй...
если собрались построчно - первый... но при падении КХ данные могут быть в недетерминированном состояниии
что такое недетерминированное состояние
источник

GR

Gubaydullin Ruslan in ClickHouse не тормозит
у меня упал кликхаус
источник

GR

Gubaydullin Ruslan in ClickHouse не тормозит
что теперь делать?
источник

AR

Alexander Ryzhenko in ClickHouse не тормозит
Доброго времени суток. Подскажите, чем можно подробно мониторить КХ?

У нас на сервере 60+ таблиц с kafka engine, которые складываются в обычные таблицы. С этих обычных таблиц мы читаем. Много. В итоге LA на сервере под 300.

Хотелось бы узнать что именно так напрягает железо (кафка, выборки, инсерты через материалки или еще что), чтобы понимать в какую сторону оптимизировать
источник

S

Slach in ClickHouse не тормозит
Maxim Bogdanov
так я ту же таблицу и джойнил 🙂 Задача была - надо было сджойнить два действия пользователя, одно за другим и сделать воронку. Ну а в кликхаусе я думал сджойнить таблицу юзеров и их действий. И там и там PK - это userID.
в clickhouse воронки считаются через windowFunnel
источник

D

Dj in ClickHouse не тормозит
Gubaydullin Ruslan
что такое недетерминированное состояние
вы запустили мутацию, во время неё упал КХ. половина обновится, другая нет
источник

РА

Роман Агилов... in ClickHouse не тормозит
Добрый день, коллеги. Продолжу с вопросом, который начал Руслан
источник

РА

Роман Агилов... in ClickHouse не тормозит
в папке таблицы /var/lib/clickhouse/data/stat/hit сейчас куча мутаций
источник

РА

Роман Агилов... in ClickHouse не тормозит
root@stat:/var/lib/clickhouse/data/stat/hit# cat mutation_9305862.txt
format version: 1
create time: 2020-08-31 14:55:45
commands: UPDATE source = \'https://balramagyar.hu/2020/08/01/gyurcsany-ferenc-gyakorlatilag-megfenyegette-vidnyanszkyt/\' WHERE id = \'9190617\'
источник

РА

Роман Агилов... in ClickHouse не тормозит
вот пример содержимого одного из файлов
источник

РА

Роман Агилов... in ClickHouse не тормозит
если я  сейчас просто удалю эти мутации из папки и перезапущу сервер - что будет?
источник