Size: a a a

ClickHouse не тормозит

2020 June 03

M

Maxim Bogdanov in ClickHouse не тормозит
То есть особенность моего подхода в том, что я буду интенсивно записывать сразу во множество партиций, нежели в одну текущую.
источник

SD

Stanislav Dimitriev in ClickHouse не тормозит
Насколько я знаю, во много партиций сразу писать не очень рекомендуется, скорее всего, это будет медленнее. Кроме того, есть ограничение дефолтное на возможность записать за раз в максимум 100 партиций
источник

M

Maxim Bogdanov in ClickHouse не тормозит
Спасибо. Надо попробовать. Одновременно 100 партиций — это, пожалуй, перебор. Но у меня особенность генератора данных — он генерит сразу все данные по одному юзеру за всю историю его сессий, пишет в бд, затем переходит к другому, из-за этого и затрагивается сразу много партиций.
источник

AT

Al T in ClickHouse не тормозит
ну они не сразу а во время мержа у вас будут затронуты потому что сортировка идет по ключу следовательно надо пересортировать, ну а там зависит уже от скорости дисков, размера данных
источник

A

Andrey in ClickHouse не тормозит
Maxim Bogdanov
Подскажите пожалуйста, будет ли для кликхауса разница (в основном интересует скорость индексации или ещё какие-то ньюансы, которые могут возникнуть), буду я делать записи в рамках примерно одинакового таймфрейма (CreatedAt записей монотонно увеличивается) или буду добавлять пачками записи, где CreatedAt будет размазан, например, сразу на год? К примеру, есть действия пользователя. Обычно они пишутся по факту возникновения. Но мне нужно записать в бд сразу все действия пользователя, сделанные за год.
Зависит от партиционирования и ключа сортировки.
Если данные сортированные льются, мержи будут проходить быстрее.
Что касается партиций, если сразу льете во множество, то будет создаваться по парту на каждую партицию, это будет достаточно сильно влиять на IO.
источник

M

Maxim Bogdanov in ClickHouse не тормозит
Интересно. Попробую ещё в самом генераторе организовать временное окно, но это сильно много памяти потребуется.
источник

AT

Al T in ClickHouse не тормозит
в клике есть временные окна - buffer tables )) оттуда можно вставлять отсортированными
источник

M

Maxim Bogdanov in ClickHouse не тормозит
Почитал, это чуть другое. Буферизировать я могу в генераторе, я это и делаю. Я имел в виду, что мне нужно в идеале писать всё во временном окне/в одной партиции, чтобы работало, как в реальности, а для этого нужно хранить все сессии всех пользоватей в памяти, что очень и очень накладно.
источник

AT

Al T in ClickHouse не тормозит
вы можете вставлять в буферную таблицу в каком угодно порядке, а когда оттуда вычитываете через INSERT INTO SELECT делаете ORDER BY по ключу
источник

AT

Al T in ClickHouse не тормозит
имхо это сильно проще чем делать это в генераторе
источник

AT

Al T in ClickHouse не тормозит
да и в общем и целом мне кажется стоит просто попробовать вставить в клик как вам удобно - возможно что на ваших объемах / железе вы и не почувствуете разницы
источник

ДА

Денис Анатольевич... in ClickHouse не тормозит
здравствуйте, подскажите, можно ли запросить выборку из определенной партиции? мне известно примерное время, однако, при запросе
where time='2019-06-18 16:03:18'
оно лопатит все данные, хотя логика подсказывает, что можно искать в партиции за данный месяц
источник

SC

Smoked Cheese in ClickHouse не тормозит
а какой order by/primary key у таблицы?
источник

ДА

Денис Анатольевич... in ClickHouse не тормозит
гм, не указываю  при запросе, есть разница?
источник

SC

Smoked Cheese in ClickHouse не тормозит
не, у самой таблицы
источник

ДА

Денис Анатольевич... in ClickHouse не тормозит
в структуре? date
источник

ДА

Денис Анатольевич... in ClickHouse не тормозит
ENGINE = MergeTree(date, (---, --, --), 8192)
источник

S

Slach in ClickHouse не тормозит
Егор Андреевич
ну и обрыв метрик так выглядит
ну поскольку у вас переход на новую версию
то это уже новые инстансы кликхауса и поэтому у вас уже новые метрики с новыми labels показываются, не важно где это хранится

а насчет того что показатели упали, ну это же к вашему clickhouse запросы идут
вы их в приложении никак не можете проверить? чтобы точно знать,
возможно эти вещи никак не связаны
источник

SC

Smoked Cheese in ClickHouse не тормозит
добавляйте тогда в запрос ещё where date='2019-06-18'
источник

ДА

Денис Анатольевич... in ClickHouse не тормозит
ага, тогда оно по немувыберет :) класс. спасибо, попробую
источник