Size: a a a

ClickHouse не тормозит

2020 June 02

l

lnuynxa in ClickHouse не тормозит
Ivan
попробую еще раз, мало ли:D
кто-нибудь может подсказать, почему при одинаковой выборке из двух таблиц, в одной из которых тип данных Enum8, а во второй LowCardinality(String), при одинаковом кол-ве прочитанных строк, прочитанных данных по объему больше в случае с Enum
он же по идее должен быть 1байтным, а словарь 4байтным? (уникальных значений всего 6)

Пример запроса и результатов:
SELECT field FROM table group by field order by count()

LowCardinality: 0.59 sec.| 215,835,807 rows.| 206 MB
Enum8: 0.51 sec.| 215,835,967 rows.| 1 GB

P.S. пробовал тот же трюк на других полях (тоже Enum и LowCardinality, всегда разница в объеме +- в 5 раз)
попробуй сравнить размер колонок в system.columns
источник

l

lnuynxa in ClickHouse не тормозит
SELECT  CAST(field AS UInt8) FROM table group by  CAST(field AS UInt8)  order by count()
источник

l

lnuynxa in ClickHouse не тормозит
попробуй так ради интереса
источник

I

Ivan in ClickHouse не тормозит
словари не кастятся в числа
источник

I

Ivan in ClickHouse не тормозит
размер колонок тоже проблематично сравнить, одна таблица - подмножество второй, сравниваю все по партициям, а в columns таблице нет такой возможности
источник

l

lnuynxa in ClickHouse не тормозит
Ivan
словари не кастятся в числа
я про enum
источник

I

Ivan in ClickHouse не тормозит
с енамом тот же результат, что и без каста
источник

DC

Denny Crane (I don't... in ClickHouse не тормозит
Ivan
размер колонок тоже проблематично сравнить, одна таблица - подмножество второй, сравниваю все по партициям, а в columns таблице нет такой возможности
Есть parts_columns
источник

АБ

Александр Благов... in ClickHouse не тормозит
добрый день, подскажите, как правильно полностью удалить данные о zookeeper. Были убраны все движки Replicated и удалены пути зк, сервер остался один, без реплик
в логе -
Coordination::Exception: All connection tries failed while connecting to ZooKeeper
в конфиге данные о кластере и зк закоментировал
источник

I

Ivan in ClickHouse не тормозит
спасибо! пойду смотреть)
источник

DC

Denny Crane (I don't... in ClickHouse не тормозит
Александр Благов
добрый день, подскажите, как правильно полностью удалить данные о zookeeper. Были убраны все движки Replicated и удалены пути зк, сервер остался один, без реплик
в логе -
Coordination::Exception: All connection tries failed while connecting to ZooKeeper
в конфиге данные о кластере и зк закоментировал
Рестартовали кх?
источник

АБ

Александр Благов... in ClickHouse не тормозит
да, но только после того, как убрал данные из .sql , после изменения конфига не рестартовал
источник

DC

Denny Crane (I don't... in ClickHouse не тормозит
Александр Благов
да, но только после того, как убрал данные из .sql , после изменения конфига не рестартовал
Кх не применяет изменения конфига зк без рестарта
источник

АБ

Александр Благов... in ClickHouse не тормозит
Denny Crane (I don't work at Yandex (never did))
Кх не применяет изменения конфига зк без рестарта
понял, спасибо
источник

Д

Данияр in ClickHouse не тормозит
Всем привет, в кликхаусе есть либы для нечеткого поиска?
источник

S

Slach in ClickHouse не тормозит
Данияр
Всем привет, в кликхаусе есть либы для нечеткого поиска?
ngram индексы только есть
источник

Д

Данияр in ClickHouse не тормозит
можно статью если нетрудно?
источник

DC

Denny Crane (I don't... in ClickHouse не тормозит
Данияр
Всем привет, в кликхаусе есть либы для нечеткого поиска?
источник

DV

Dmitry Vasiliev in ClickHouse не тормозит
есть банальная таблица с (time, http_code, http_path, …)
хочется сделать count по времени и вывести top50 http_path, какие функции у clickhouse могут помочь?
источник

AO

Andrey Oleynik in ClickHouse не тормозит
Привет, подскажите как лучше оргинизовать в Clickhouse хранение событий с разными параметрами? Те у них есть общая часть и у каждого что-то свое. Изначально хотелось положить различающиеся параметры в одно поле в виде json, но Clickhouse, как я понял, не позволяет делать выборки по таким колонкам.
Нашел статью от баду, они хранят ключи и значения в массивах, а потом изгаляются и строят графики: (https://habr.com/ru/company/badoo/blog/442616/). Так принято делать? Или есть более правильные варианты?
источник