Size: a a a

ClickHouse не тормозит

2020 May 19

A

Andrey in ClickHouse не тормозит
Илья Максимов
К вопросу о партиционировании. Как понять как его ставить? На проде стоит дневные партиции, потому что есть страх, что когда ивентов станет много, то мы не сможем дропнуть последний день месяца руками и почистить место. А так можем
А долго храните?
источник

ИМ

Илья Максимов... in ClickHouse не тормозит
Собственно 35 дней пока позволяет 8 нод)
источник

AL

Alexey Likutov in ClickHouse не тормозит
фига се у вас данные
источник

AL

Alexey Likutov in ClickHouse не тормозит
Shazo
500к в день выглядит мало, можно оставить месяц.
спасибо)
источник

S

Shazo in ClickHouse не тормозит
ноды могут быть разные. У нас где 7+ лярдов в день -  дневное, а остальные в основном месячные.
источник

A

Andrey in ClickHouse не тормозит
Илья Максимов
Собственно 35 дней пока позволяет 8 нод)
ну там суть в том что при большом количестве партиций, при обширных селектах может убиваться IO, и при увеличивается время перезапуска ClickHouse.
Но это конечно не про ту ситуацию когда у вас 35 партиций))
источник

ИМ

Илья Максимов... in ClickHouse не тормозит
Andrey
ну там суть в том что при большом количестве партиций, при обширных селектах может убиваться IO, и при увеличивается время перезапуска ClickHouse.
Но это конечно не про ту ситуацию когда у вас 35 партиций))
Другими словами текущая связка с дневными партициями это норма? Нет смысла делать по месяцам
источник

A

Andrey in ClickHouse не тормозит
Илья Максимов
Другими словами текущая связка с дневными партициями это норма? Нет смысла делать по месяцам
Ну смотрите, тут по опыту многое зависит от дисков.
Если вы например будете хранить 1 год, то это уже будет 365 партиций, а если 3 года то 1095. На обычных HDD это уже может быть ощутимо. А те же SSD/NVME проглотят без вопросов.
источник

A

Andrey in ClickHouse не тормозит
А если вы планируете хранить например год, то уверены ли вы что дропать будете по дням? В масштабах года мне кажется уже можно смотреть в сторону недельных/месячных партиций. Но все конечно зависит от бизнеса. Кому то и полгода от года дропнуть не страшно)
источник

AT

Al T in ClickHouse не тормозит
Илья Максимов
Собственно 35 дней пока позволяет 8 нод)
а зачем хранить сами ответы в базе (да и еще и в разных форматах) вы по ним ищете?
источник

ИМ

Илья Максимов... in ClickHouse не тормозит
Al T
а зачем хранить сами ответы в базе (да и еще и в разных форматах) вы по ним ищете?
Не много строим. Скорее для денежных расчётов в конце периода. А графики по большей части по count()
источник

AT

Al T in ClickHouse не тормозит
не очень понял сорри... сам текст ответа парсится по колонкам чтобы некоторые данные потом считать плюс хранится еще весь ответ на всякий случай?
источник

SA

Sergei Alekseev in ClickHouse не тормозит
Добрый день! подскажите плиз когда стоит дробить партиции, например по дням или часам? Что это дает и как влияет на производительность?
источник

R

RVR in ClickHouse не тормозит
Привет всем, столкнулся с проблемой - использую CH через HTTP интерфейс (либа clickhouse для nodejs), у меня есть здоровенный по размеру селект (просто очень большое перечисление в WHERE состоящее из кучи конструкций OR/AND и автогенерируемое).
Проблема заключается в следующем - как только запрос достигает определенного размера сервер начинает сыпать 'CH  Error: 400: Bad Request'.
У меня стойкое ощущение что где-то упираюсь в лимит по размеру запроса, какую настройку пошатать?
источник

NP

Nikolay Pekaln in ClickHouse не тормозит
RVR
Привет всем, столкнулся с проблемой - использую CH через HTTP интерфейс (либа clickhouse для nodejs), у меня есть здоровенный по размеру селект (просто очень большое перечисление в WHERE состоящее из кучи конструкций OR/AND и автогенерируемое).
Проблема заключается в следующем - как только запрос достигает определенного размера сервер начинает сыпать 'CH  Error: 400: Bad Request'.
У меня стойкое ощущение что где-то упираюсь в лимит по размеру запроса, какую настройку пошатать?
У GET запроса http есть лимит у POST - нет, используй POST.
источник

R

RVR in ClickHouse не тормозит
хм там вроде POST используется, но спасибо за идею, надо потрассировать - вдруг и правда GET
источник

A

Andrey in ClickHouse не тормозит
Sergei Alekseev
Добрый день! подскажите плиз когда стоит дробить партиции, например по дням или часам? Что это дает и как влияет на производительность?
В основном для удаления. Чем больше партиций, тем тяжелее их все вместе читать. Плодится большое количество файлов. Но все это конечно сильно зависит от дисков.
источник

A

Andrey in ClickHouse не тормозит
RVR
Привет всем, столкнулся с проблемой - использую CH через HTTP интерфейс (либа clickhouse для nodejs), у меня есть здоровенный по размеру селект (просто очень большое перечисление в WHERE состоящее из кучи конструкций OR/AND и автогенерируемое).
Проблема заключается в следующем - как только запрос достигает определенного размера сервер начинает сыпать 'CH  Error: 400: Bad Request'.
У меня стойкое ощущение что где-то упираюсь в лимит по размеру запроса, какую настройку пошатать?
источник

ИМ

Илья Максимов... in ClickHouse не тормозит
Al T
не очень понял сорри... сам текст ответа парсится по колонкам чтобы некоторые данные потом считать плюс хранится еще весь ответ на всякий случай?
Я не упоминал никаких «ответов» и текста парсящего в разных форматах. Вы наверное не того человека упомянули в чате
источник

R

RVR in ClickHouse не тормозит
Nikolay Pekaln
У GET запроса http есть лимит у POST - нет, используй POST.
действительно оказалось что для SELECT либа почему-то использует GET. А нет возможности изменить предел GET в CH? Технически то разницы особо нет
источник