Size: a a a

ClickHouse не тормозит

2020 May 27

S

Slach in ClickHouse не тормозит
Старый Хрыч
😐честно сказать я по факту сейчас думаю, как лучше объяснить, что архивные и свежие данные лучше хранить на разных кластерах, а не в разных партициях
ээээ... у вас петабайты? если нет, то партиции сгодятся...
источник

СХ

Старый Хрыч... in ClickHouse не тормозит
Slach
ээээ... у вас петабайты? если нет, то партиции сгодятся...
не, петабайты у меня были на другом проекте, и там я от кликхауса отговорил, поставили scylla+sparksql.
тут я пока "предполагаю" будет 200-300 тб на 5-6 серверов
источник

СХ

Старый Хрыч... in ClickHouse не тормозит
если моя догадка верна, сегодня получу доступ к графане, то у заказчика постоянно зашкаливает iowait
источник

СХ

Старый Хрыч... in ClickHouse не тормозит
https://habr.com/ru/company/yandex/blog/459198/
эту статейку на хабре я читал
источник

СХ

Старый Хрыч... in ClickHouse не тормозит
но что делать, если при хранении архивных и быстрых данных в 1 ноде постоянно будет iowait зашкаливать, не ясно
источник

СХ

Старый Хрыч... in ClickHouse не тормозит
на одном из прошлых проектов мы решили это так
1) вы вынесли из ch все данные, и  заливали в него их только на построение olap кубов и тп
2) мы вынесли в него только счётчики
источник

AK

Alexey Kostarev in ClickHouse не тормозит
Добрый день, коллеги

Не силён в агрегирующих запросах и функциях. Можете помочь?

У меня eсть таблица со структурой

CREATE TABLE flow (
 time DateTime64(9),
 code UInt64,
 text String,
 answers Array(UInt8)
) ENGINE = MergeTree()
PARTITION BY time
ORDER BY time;

Пример строк:
─────────────-──────time─┬─code─┬text─┬─answers─┐
│ 2020-05-27 08:15:14.429163145 │ 1    │ A          │ [1,2,3] │
│ 2020-05-27 08:15:14.429163147 │ 2    │ B          │ [3,2,1] │
│ 2020-05-27 08:15:14.429163148 │ 1    │ C          │ [2,2,2] │
│ 2020-05-27 08:15:14.429163149 │ 1    │ D          │ [2,3,1] │
│ 2020-05-27 08:15:14.429163150 │ 2    │ E          │ [1,1,1] │

Мне надо составить запрос выбирающий для каждого уникального code (как я понимаю GROUP BY code)
его первое вхождение. Если быть точнее - с минимальным временм.
То есть результат должен быть:
────────────────────time─┬─code─┬──text─┬─answers─┐
│ 2020-05-27 08:15:14.429163145 │ 1    │ A          │ [1,2,3] │
│ 2020-05-27 08:15:14.429163147 │ 2    │ B          │ [3,2,1] │
источник

MM

Mariya Mansurova in ClickHouse не тормозит
Alexey Kostarev
Добрый день, коллеги

Не силён в агрегирующих запросах и функциях. Можете помочь?

У меня eсть таблица со структурой

CREATE TABLE flow (
 time DateTime64(9),
 code UInt64,
 text String,
 answers Array(UInt8)
) ENGINE = MergeTree()
PARTITION BY time
ORDER BY time;

Пример строк:
─────────────-──────time─┬─code─┬text─┬─answers─┐
│ 2020-05-27 08:15:14.429163145 │ 1    │ A          │ [1,2,3] │
│ 2020-05-27 08:15:14.429163147 │ 2    │ B          │ [3,2,1] │
│ 2020-05-27 08:15:14.429163148 │ 1    │ C          │ [2,2,2] │
│ 2020-05-27 08:15:14.429163149 │ 1    │ D          │ [2,3,1] │
│ 2020-05-27 08:15:14.429163150 │ 2    │ E          │ [1,1,1] │

Мне надо составить запрос выбирающий для каждого уникального code (как я понимаю GROUP BY code)
его первое вхождение. Если быть точнее - с минимальным временм.
То есть результат должен быть:
────────────────────time─┬─code─┬──text─┬─answers─┐
│ 2020-05-27 08:15:14.429163145 │ 1    │ A          │ [1,2,3] │
│ 2020-05-27 08:15:14.429163147 │ 2    │ B          │ [3,2,1] │
Привет, для этого в CH есть функция argMin - https://clickhouse.tech/docs/en/sql-reference/aggregate-functions/reference/#agg-function-argmin
источник

AK

Alexey Kostarev in ClickHouse не тормозит
Спасибо! А можно мне как новичку в SQL запрос написать?
источник

AK

Alexey Kostarev in ClickHouse не тормозит
Нужно ли мне строки группировать по GROUP BY code
и как сохранить значения столбцов text, answers
источник

ИМ

Илья Максимов... in ClickHouse не тормозит
Сем привет :)
Каким образом в system.parts колонках min_date, max_date, min_time, max_time устанавливаются значения? У меня есть некоторая логика на дропании старых партов, которая завязана на колонке min_date и, как оказалось, иногда она отсутствует
источник

S

Slach in ClickHouse не тормозит
Alexey Kostarev
Спасибо! А можно мне как новичку в SQL запрос написать?
можно, переведите мне 50 USD на yandex деньги, напишу запрос
источник

Д

Данияр in ClickHouse не тормозит
Slach
можно, переведите мне 50 USD на yandex деньги, напишу запрос
неплохой ценник
источник

AK

Alexey Kostarev in ClickHouse не тормозит
Slach
можно, переведите мне 50 USD на yandex деньги, напишу запрос
Спасибо. Буду иметь в виду, а то я тут забесплатно пару комментариев раздал
источник

S

Slach in ClickHouse не тормозит
Alexey Kostarev
Спасибо. Буду иметь в виду, а то я тут забесплатно пару комментариев раздал
раздать комментарии и решить задачу, две разные вещи
источник

S

Slach in ClickHouse не тормозит
Данияр
неплохой ценник
дешево очень
источник

Д

Дима in ClickHouse не тормозит
Slach
дешево очень
да? 50 за запрос - дешево?
источник

AK

Alexey Kostarev in ClickHouse не тормозит
Slach
раздать комментарии и решить задачу, две разные вещи
Ну да иногда хороший совет ценнее кучи написанного кода
источник

S

Shazo in ClickHouse не тормозит
Сейчас тогда Denny многим тут выставит счет)
источник

S

Slach in ClickHouse не тормозит
Дима
да? 50 за запрос - дешево?
вы можете сделать все за бесплатно, @kafnevod останется доволен =)
источник