Size: a a a

ClickHouse не тормозит

2021 February 19

MD

Mikhail Dengin in ClickHouse не тормозит
Поэтому и приходится использовать неизменяюмую дату для партиционирования, но её как раз нельзя применить в запросах в таком случае.
источник

AK

Alexey Kostarev in ClickHouse не тормозит
А про чутка можно поподробнее?

Да и меня интересует насколько сыровато и в Postgres Wire Protocol

На первый взгляд основные команды из postgres-клиентов выполняются...
источник

DT

Dmitry Titov in ClickHouse не тормозит
Mikhail Dengin
Тогда возникает проблема:
Допустим мы вставили строку с 31.01.XXXX для данных.
Затем эти данные изменились, вставляем новую строку с 01.02.XXXX свежими данными и более новой версией.
Соответственно мы получим задвоение данных, они появятся в том числе при выборке за Январь.
Какой размер таблицы ожидается?
вам нужно сохранять только последнее значение?
источник

MD

Mikhail Dengin in ClickHouse не тормозит
Dmitry Titov
Какой размер таблицы ожидается?
вам нужно сохранять только последнее значение?
В пределах миллиарда строк.
Да нужно использовать более свежее значение всегда, поэтому и выбрали ReplacingMergeTree.
источник

DT

Dmitry Titov in ClickHouse не тормозит
Alexey Kostarev
А про чутка можно поподробнее?

Да и меня интересует насколько сыровато и в Postgres Wire Protocol

На первый взгляд основные команды из postgres-клиентов выполняются...
> На первый взгляд основные команды из postgres-клиентов выполняются...
Ну если вас все устраивает, то хорошо :)

https://github.com/ClickHouse/ClickHouse/issues/20869
источник

DT

Dmitry Titov in ClickHouse не тормозит
Mikhail Dengin
В пределах миллиарда строк.
Да нужно использовать более свежее значение всегда, поэтому и выбрали ReplacingMergeTree.
Ну, если остаетесь на clickhouse 20.6, то если заранее известен возможный диапазон group_id то лучше использовать intDiv, и я бы не стал делать больше 50 партиций
источник

MD

Mikhail Dengin in ClickHouse не тормозит
Dmitry Titov
Ну, если остаетесь на clickhouse 20.6, то если заранее известен возможный диапазон group_id то лучше использовать intDiv, и я бы не стал делать больше 50 партиций
Обновиться не проблема, я думаю. Там подъехало что-то в свежих версиях, связанное с этим?
источник

DT

Dmitry Titov in ClickHouse не тормозит
1млрд/50 ~ 20млн строк на партиции, очень даже мало
источник

AK

Alexey Kostarev in ClickHouse не тормозит
Спасибо за информация
Насчет Wire Protocol не могу сказать все ли устраивает
Пока сильно поверхностный взгляд, но в ближайшее время  углубим...
источник

DT

Dmitry Titov in ClickHouse не тормозит
Mikhail Dengin
Обновиться не проблема, я думаю. Там подъехало что-то в свежих версиях, связанное с этим?
кликхаус сможет использовать % для партишн прунниг
Но эт ток с 20.12
https://github.com/ClickHouse/ClickHouse/pull/16253
источник

DT

Dmitry Titov in ClickHouse не тормозит
Alexey Kostarev
Спасибо за информация
Насчет Wire Protocol не могу сказать все ли устраивает
Пока сильно поверхностный взгляд, но в ближайшее время  углубим...
Ну, будут проблемы пишите багрепорты на гитхаб.
источник

MD

Mikhail Dengin in ClickHouse не тормозит
Спасибо!
источник

DT

Dmitry Titov in ClickHouse не тормозит
В целом можете вообще без партиций попробовать, кх не будет мержить парты если они более 100гб будут
источник

АЗ

Александр Загребельн... in ClickHouse не тормозит
По настройкам КХ вопрос: исполнение запроса в КХ через драйвер ODBC прерывается по таймауту. Можно это  ограничение обойти какой-либо настройкой КХ ? http_connection_timeout не помогла...
источник

L

Lazoreth in ClickHouse не тормозит
Ребят, подскажите пожалуйста - Есть таблица с десятком полей, 5 из них могут быть NULL в зависимости от типа, из-за того что таблица сводная. Есть может быть в кх какие-то более цивилизованные методы для реализации подобных таблиц. Не нравятся лишние поля в тех типах где они не нужны
источник

DT

Dmitry Titov in ClickHouse не тормозит
Александр Загребельный
По настройкам КХ вопрос: исполнение запроса в КХ через драйвер ODBC прерывается по таймауту. Можно это  ограничение обойти какой-либо настройкой КХ ? http_connection_timeout не помогла...
источник

DT

Dmitry Titov in ClickHouse не тормозит
Lazoreth
Ребят, подскажите пожалуйста - Есть таблица с десятком полей, 5 из них могут быть NULL в зависимости от типа, из-за того что таблица сводная. Есть может быть в кх какие-то более цивилизованные методы для реализации подобных таблиц. Не нравятся лишние поля в тех типах где они не нужны
Какой процент из тех значений может быть null?
источник

L

Lazoreth in ClickHouse не тормозит
Dmitry Titov
Какой процент из тех значений может быть null?
~50% . На портах например нужны subnet\network id. А на дисках нет, таких полей около 5 штук
источник

RM

Roman Maksimov in ClickHouse не тормозит
Привет! Подскажите, какие есть варианты настройки старой версии КХ(19.14) для разделения таблиц по разным дискам? Кроме использования симлинков
источник

L

Lazoreth in ClickHouse не тормозит
Сводная таблица для отчётов быстрых нужна, бегать по всем таблицам не варик
источник