Size: a a a

ClickHouse не тормозит

2021 February 09

S

Slach in ClickHouse не тормозит
Mihail Kuzmin
У меня есть табличка с событиями. Я хочу посчитать воронку вида "какой процент пользователей, которые до этого тыкнули в определенную кнопку, сделали потом что-то".

То есть в обычном мире я бы либо поселектил в переменную пользователей, которые тыкнули в кнопку, а потом поселектил всех пользователей, сделавших что-то и входящих в этот список (переменную), либо сделал в where условие вида user in (select from)
источник

TS

Timur Sabirov in ClickHouse не тормозит
Timur Sabirov
создалась табличка, но опять разница в 2 раза, делаю select uniqExact(idto) from  schema1.id_all where id = xxxxxx
выдает 479 записей, делаю тот же запрос на производной таблице, выдает 249 записей
производная таблица создавалась create table schema1.agg_id engine = MergeTree order by id as select id, idto from schema1.id_all group by id, idto
есть идеи в чем может быть проблема?
источник

D

Dj in ClickHouse не тормозит
Timur Sabirov
создалась табличка, но опять разница в 2 раза, делаю select uniqExact(idto) from  schema1.id_all where id = xxxxxx
выдает 479 записей, делаю тот же запрос на производной таблице, выдает 249 записей
производная таблица создавалась create table schema1.agg_id engine = MergeTree order by id as select id, idto from schema1.id_all group by id, idto
не все вставилось... так бывает... сделайте select count() сравнение табличек
источник

TS

Timur Sabirov in ClickHouse не тормозит
count  по любому же будет меньше, так как производная табличка это сагрегированные данные?
источник

AV

Alex Vorobiev in ClickHouse не тормозит
добрый день, столкнулись с проблемой зависания таблицы (engine mysql), любая операция drop/rename/select вызывает бесконечное зависание. в логах запросов можно увидеть следующую ошибку:

Code: 473, e.displayText() = DB::Exception: WRITE locking attempt on "database.tablename" has timed out! (120000ms) Possible deadlock avoided. Client should retry. (version 20.4.4.18 (official build))

погуглили после этого, вроде пишут, что это баг, связанный с возникновением дедлока при alter таблицы и он был починен в 20.6 обновились до 21, но сама проблема никуда не исчезает, таблица залочена намертво. убиваем вручную запросы, которые с ней как либо связаны, но запрос на убийство запроса тоже зависает зачастую. кто-то сталкивался с таким поведением?
источник

D

Dmitry Koreckiy in ClickHouse не тормозит
Всем привет
Уже сутки выполняется insert запрос запущенный через clickhouse client
Как узнать его прогресс, если на текущий момент в trace log он переименовывает tmp партиции
источник

D

Dj in ClickHouse не тормозит
Timur Sabirov
count  по любому же будет меньше, так как производная табличка это сагрегированные данные?
да, не заметил group by.
там у вас ещё aggregatedmt...
источник

TS

Timur Sabirov in ClickHouse не тормозит
я после этого создал без aggmt, все равно не бьет
источник

D

Dj in ClickHouse не тормозит
Timur Sabirov
я после этого создал без aggmt, все равно не бьет
так может вы МВ создали позже чем начали наполнять сырую таблицу? зачем там вообще aggregating MT? я вообще потерял нить и в чем была проблема у вас...

select distinct [keys] from raw
select distinct [keys] from mv
дают разные значения?
источник

TS

Timur Sabirov in ClickHouse не тормозит
сначала создал aggmt потом мне тут подсказали что не правильно, создал create table as select group by id, idto без aggmt
табличка создалась но разница при запросах примерно 2 раза с главной таблицей
249 против 479
источник

D

Dj in ClickHouse не тормозит
Timur Sabirov
сначала создал aggmt потом мне тут подсказали что не правильно, создал create table as select group by id, idto без aggmt
табличка создалась но разница при запросах примерно 2 раза с главной таблицей
249 против 479
Ну сделайте
Select from main where (id, idto) not in (select from new)

Возьмите первую попавшуюся строку.

И select from new where id=a and idto=b;
источник

TS

Timur Sabirov in ClickHouse не тормозит
в err логах attempt to read after eof
источник

TS

Timur Sabirov in ClickHouse не тормозит
ок сча попробую
источник

TS

Timur Sabirov in ClickHouse не тормозит
Dj
Ну сделайте
Select from main where (id, idto) not in (select from new)

Возьмите первую попавшуюся строку.

И select from new where id=a and idto=b;
да, данных нет в производной таблице
источник

D

Dj in ClickHouse не тормозит
Timur Sabirov
в err логах attempt to read after eof
ну у вас не все вставилось тогда, инсерт умер не дойдя до конца
источник

TS

Timur Sabirov in ClickHouse не тормозит
получается нет решения для high cardinality group by?
источник

D

Dj in ClickHouse не тормозит
Timur Sabirov
получается нет решения для high cardinality group by?
select id, idto from rawtable group by id, idto;
select distinct id,idto from rawtable;

оба должны работать без проблем
источник

TS

Timur Sabirov in ClickHouse не тормозит
всего 700 ГБ памяти, max_memory_usage выставлен 600 max_memory_usage_before_external_group_by 300GB, данные спиллятся на диск, но вылетает по ООМ, что может быть не так?
источник

TS

Timur Sabirov in ClickHouse не тормозит
в dmesg ругается 'clickhouse-serv' uses 32-bit capabilities
источник

AS

Alexey Shcherbakov in ClickHouse не тормозит
Привет всем, настраивал кто-нибудь уже с 21.2.2.8 LDAP с мапингом ролей? Вроде все сделал как написано в конфигах, настроил фильтры и тд. Пытаюсь войти, CH дергает LDAP, там все успешно, но дальше выдает что не пущу, а за ролями даже не идет (смотрю в wireshark) 😕
источник