Телеграмм чат группы clickhouse_ru страница 9497

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

ClickHouse не тормозит

5029 membersпожаловаться на группу

2021 March 15

AS

Alexey Sokolov in ClickHouse не тормозит

В моем сообщение ключевым моментом было то, что именно вы хотите замерить. Вы не ответили и ушли тестить:)
Таблица null?

Типичная ситуация, да?))

Мне нужно замерить в первую очередь рост потребления памяти, во вторую - рост нагрузки на проц. Сейчас всё это вычитывается внешней приложухой, а я хочу передать эту почётную обязанность самому КХ.

Нет, тестил на обычной MT таблице (связка KafkaEngine -> MV -> MT), чтобы всё как по-настоящему.

источник

14:32пожаловаться #1

TG

Tagir Gumerov in ClickHouse не тормозит

Типичная ситуация, да?))

Мне нужно замерить в первую очередь рост потребления памяти, во вторую - рост нагрузки на проц. Сейчас всё это вычитывается внешней приложухой, а я хочу передать эту почётную обязанность самому КХ.

Нет, тестил на обычной MT таблице (связка KafkaEngine -> MV -> MT), чтобы всё как по-настоящему.

Хм, я не ожидал, что 15k rps будет "бесплатным", пусть даже на одной таблице.
В чате писали, что при использовании KafkaEngine узким местом бывает диск: много топиков льют данные в одну или разные таблицы, возникает много партов, они не успевают мержиться. Но кх не про создание на одной ноде 100 kafka читателей.
Собственно вы выяснили, что память и cpu не сильно деградируют:)

источник

14:51пожаловаться #2

SD

Stanislav Didenko in ClickHouse не тормозит

Добрый день! Подскажите пожалуйста, есть таблица с движком AggregatingMergeTree:
———

CREATE TABLE IF NOT EXISTS prices.hashes
(
    hash     String,
    found_at AggregateFunction(max, DateTime)
)
ENGINE = AggregatingMergeTree()
ORDER BY (hash);

————

Попытка сделать прямой insert
INSERT INTO prices.hashes (hash, found_at) VALUES ('some_hash', toDateTime('2021-03-15 12:00:03’))

завершается ошибкой: Cannot convert UInt64 to AggregateFunction(max, DateTime)

Есть ли какой-то правильный способ писать данные в AggregatingMergeTree, если не через MaterializedView и не через INSERT INTO … SELECT … ?

источник

15:07пожаловаться #3

DT

Dmitry Titov in ClickHouse не тормозит

Stanislav Didenko

Добрый день! Подскажите пожалуйста, есть таблица с движком AggregatingMergeTree:
———

CREATE TABLE IF NOT EXISTS prices.hashes
(
    hash     String,
    found_at AggregateFunction(max, DateTime)
)
ENGINE = AggregatingMergeTree()
ORDER BY (hash);

————

Попытка сделать прямой insert
INSERT INTO prices.hashes (hash, found_at) VALUES ('some_hash', toDateTime('2021-03-15 12:00:03’))

завершается ошибкой: Cannot convert UInt64 to AggregateFunction(max, DateTime)

Есть ли какой-то правильный способ писать данные в AggregatingMergeTree, если не через MaterializedView и не через INSERT INTO … SELECT … ?

https://clickhouse.tech/docs/en/sql-reference/data-types/simpleaggregatefunction/

clickhouse.tech

SimpleAggregateFunction | ClickHouse Documentation

SimpleAggregateFunction SimpleAggregateFunction(name, types_of_arguments…) data type stores current value of the aggrega

источник

15:08пожаловаться #4

ВА

Василий Аверьянов... in ClickHouse не тормозит

в новых версиях есть OPTIMIZE DEDUPLICATE BY columns.

какой ORDER BY таблицы

Спасибо за наводку - попробую! А проблема возпроизводится даже в таблице (merge engine) с 1 колонкой (id UInt8) и order by id соотвественно.

источник

15:16пожаловаться #5

DT

Dmitry Titov in ClickHouse не тормозит

Василий Аверьянов

Спасибо за наводку - попробую! А проблема возпроизводится даже в таблице (merge engine) с 1 колонкой (id UInt8) и order by id соотвественно.

Вообще эти подзапросы очень сомнительная вещь.
Мы обычно рекомендуем делать таблицу с id на нее вешать словарь и пользоватся dictHas

источник

15:17пожаловаться #6

SD

Stanislav Didenko in ClickHouse не тормозит

https://clickhouse.tech/docs/en/sql-reference/data-types/simpleaggregatefunction/

clickhouse.tech

SimpleAggregateFunction | ClickHouse Documentation

SimpleAggregateFunction SimpleAggregateFunction(name, types_of_arguments…) data type stores current value of the aggrega

спасибо! понял, помогло)

источник

15:20пожаловаться #7

DC

Denny Crane [not a Y... in ClickHouse не тормозит

Витя Сергеев

добрый день, не смог найти похожего на свое поэтому пришел с вопросом:
Например есть таблица с историческими данными, на неё надо повесить материализованную вьюху, чтобы та подцепила данные из таблицы

Сама таблица весит 1.78 GiB в настройках стоит оганичение total 6ГБ, на запрос 3ГБ ограничение на группировку и сортировку (max_bytes_before_external...) по 300мб
В общем проблема в том, что запросы создания вьюхи с populate (или пустой с последущим insert) падают то на total памяти, то на query

Вариант увеличить ram отодвинул, т.к. количество данных будет расти и вопрос в другом.
Как создать вьюху на таблице которая превышает объем RAM?

https://den-crane.github.io/Everything_you_should_know_about_materialized_views_commented.pdf
https://youtu.be/1LVJ_WcLgF8?list=PLO3lfQbpDVI-hyw4MyqxEk3rDHw95SzxJ&t=7597

последние слайды, как делать популейт вручную.

источник

16:03пожаловаться #8

DC

Denny Crane [not a Y... in ClickHouse не тормозит

Василий Аверьянов

Спасибо за наводку - попробую! А проблема возпроизводится даже в таблице (merge engine) с 1 колонкой (id UInt8) и order by id соотвественно.

вообще-то Engine=Merge и Engine=MergeTree это вообще два разных, совершенно про разное движка.
И такой delete не поддерживается

источник

16:06пожаловаться #9

ВА

Василий Аверьянов... in ClickHouse не тормозит

Denny Crane [not a Yandex bot]

вообще-то Engine=Merge и Engine=MergeTree это вообще два разных, совершенно про разное движка.
И такой delete не поддерживается

да, я имел ввиду mergetree

источник

16:07пожаловаться #10

DL

Daniil Lapko in ClickHouse не тормозит

А при left join только правая таблица загружается в память?

источник

16:28пожаловаться #11

D

Danil in ClickHouse не тормозит

пытаюсь скопировать данные между таблицами на разных хостах
разница в таблицах в одной колонке:
в оригинальной значение типа строки
во второй сделал Enum8

в запросе формирую новую колонку через multiIf()

в пределах одного хоста это работает через

INSERT INTO NewTable SELECT c1, c2, (multiIf(starsWith(c3, 'file'), 0, starsWith(c3, 'directory'), 1, starsWith(c3, 'symbolic'), 2, 3) as c3 FROM OldTable

когда пытаюсь сделать через пайп из двух консольных клиентов выдаёт ошибку что ожидается Enum8 а получен Uint8

Пробовал в пайпе конвертировать в строковые имена для Enum - тогда ругается на ошибку конdертации STring в Enum8

Как можно это победить?

источник

16:29пожаловаться #12

DN

Dmitriy Novikov in ClickHouse не тормозит

А при left join только правая таблица загружается в память?

hash join, правая в память по левой бегаем

источник

16:29пожаловаться #13

DL

Daniil Lapko in ClickHouse не тормозит

Dmitriy Novikov

hash join, правая в память по левой бегаем

Странно, есть таблица 15гб при join селекта по ней выдает ошибку что требуется памяти больше 56гб.

источник

16:33пожаловаться #14

DN

Dmitriy Novikov in ClickHouse не тормозит

Странно, есть таблица 15гб при join селекта по ней выдает ошибку что требуется памяти больше 56гб.

15 гб в каком виде?

источник

16:34пожаловаться #15

AK

Alex Krash in ClickHouse не тормозит

Странно, есть таблица 15гб при join селекта по ней выдает ошибку что требуется памяти больше 56гб.

в памяти находятся "расжатые" данные, на диски - "сжатые".

источник

16:34пожаловаться #16

DN

Dmitriy Novikov in ClickHouse не тормозит

Странно, есть таблица 15гб при join селекта по ней выдает ошибку что требуется памяти больше 56гб.

Может жрет место при построении хэш таблицы, я читал в чатике писали что у клика хэш таблицы занимают много места.

источник

16:35пожаловаться #17

DL

Daniil Lapko in ClickHouse не тормозит

Да сжатые, есть таблица А условно 200гб по ней идет селект и к нему нужно заджоинить столбец из таблицы B 15гб. В теории выглядело просто учитывая, что обе таблицы имеют одинаковые ключи сортировки, но на практике не хватает памяти и очень долго по времени. Получается что джоинить вообще всегда плохая идея и нужно все нужные данные в одной таблице иметь?

источник

16:37пожаловаться #18

DN

Dmitriy Novikov in ClickHouse не тормозит

Да сжатые, есть таблица А условно 200гб по ней идет селект и к нему нужно заджоинить столбец из таблицы B 15гб. В теории выглядело просто учитывая, что обе таблицы имеют одинаковые ключи сортировки, но на практике не хватает памяти и очень долго по времени. Получается что джоинить вообще всегда плохая идея и нужно все нужные данные в одной таблице иметь?

Джойн это концептуально плохая идея при построении dwh. Но Я бы не был так резок в таких выводах на самом деле. Иногда нужно разносить данные, делать сильно разреженную таблицу это антипаттерн, читали статью badoo? и клике

источник

16:39пожаловаться #19

DL

Daniil Lapko in ClickHouse не тормозит

Не читал, можно ссылку?)

источник

16:40пожаловаться #20