Size: a a a

ClickHouse не тормозит

2021 March 05

M

Mishanya in ClickHouse не тормозит
Это запуск мержа. Мерж воообще не гарантирует что не будет дубликатов.
источник

M

Mishanya in ClickHouse не тормозит
Возможно, можно добавить final, но это не точно
источник

O

Oleg Bazdyrev in ClickHouse не тормозит
Mishanya
В чем ваш вопрос ?
optimize table xxx DEDUPLICATE;
убирает только небольшую пачку дублей
источник

O

Oleg Bazdyrev in ClickHouse не тормозит
и работает полторы-две секунды
источник

O

Oleg Bazdyrev in ClickHouse не тормозит
впрочем OPTIMIZE TABLE xxx  FINAL DEDUPLICATE задумался
источник

M

Mishanya in ClickHouse не тормозит
Oleg Bazdyrev
и работает полторы-две секунды
Потому что ClickHouse creates a task for merging
источник

M

Mishanya in ClickHouse не тормозит
Из доки
источник

O

Oleg Bazdyrev in ClickHouse не тормозит
Mishanya
Потому что ClickHouse creates a task for merging
а FINAL DEDUPLICATE при этом работает синхронно?
источник

O

Oleg Bazdyrev in ClickHouse не тормозит
ну похоже final deduplicate вовсю работает, потихоньку дубли пропадают
источник

O

Oleg Bazdyrev in ClickHouse не тормозит
а как вообще найти дубли по ключевым полям? в случае жирной таблицы?
источник

O

Oleg Bazdyrev in ClickHouse не тормозит
казалось бы, таблица отсортирована по ним, можно тупо по порядочку идти и искать, а при аггрегации падает по памяти
источник

ЛС

Лина Саволайнен... in ClickHouse не тормозит
Oleg Bazdyrev
Привет
а OPTIMIZE DEDUPLICATE чтоли только кусок дедуплицирует?
о, привет)))))
источник

O

Oleg Bazdyrev in ClickHouse не тормозит
Лина Саволайнен
о, привет)))))
привет)
источник

DT

Dmitry Titov in ClickHouse не тормозит
Oleg Bazdyrev
ну похоже final deduplicate вовсю работает, потихоньку дубли пропадают
он убирает полные дубли.

> а как вообще найти дубли по ключевым полям? в случае жирной таблицы?
Не очень точно с помощью neighbour функции
источник

AK

Anton Komarov in ClickHouse не тормозит
Nullable(SimpleAggregateFunction(max, DateTime)) DEFAULT NULL почему то схлопывает нормальную дату и null в null. Я не туда воюю?
источник

IG

Ilya Golshtein in ClickHouse не тормозит
Добрый день, если я правильно понимаю, на clickhouse.tech/docs документация на master. Выкладывается ли куда-нибудь документация на стабильные релизы?
источник

AZ

Anton Zadorozhniy in ClickHouse не тормозит
Добрый день, подскажите пожалуйста, где почитать про поведение Kafka движка и  AvroConfluent формата при изменении схемы в регистре схем?
источник

D

Dmitry Koreckiy in ClickHouse не тормозит
Anton Komarov
Nullable(SimpleAggregateFunction(max, DateTime)) DEFAULT NULL почему то схлопывает нормальную дату и null в null. Я не туда воюю?
Возможно надо поменять
Nullable(SimpleAggregateFunction(max, DateTime)) -> SimpleAggregateFunction(max, Nullable(DateTime))
источник

MK

Max Khlystov in ClickHouse не тормозит
а есть фидбек по движку кафки и рабиту на сколько это стабильно теряет ли данные если ли дубли?
источник

СЛ

Станислав Линник... in ClickHouse не тормозит
Господа, подскажите, на 3х репликах одного шарда немного отличаются(кое где и "много")  отличаются показатели по insert row, данные из system.events.
Правильно ли я понимаю, что туда попадают еще какие-то внутренние запросы, которые делает CH по преобразованию данных?
CH - 19.17.4.11

Пишем только в distributed таблицу. НЕреплицируемых таблиц в кластере КХ нету
источник