Size: a a a

ClickHouse не тормозит

2020 September 14

АА

Александр Артамонов... in ClickHouse не тормозит
ну, кароч, планируется таблица айди товара, его позиция, дата проверки. Конечно, она будет в несколько лярдов записей. Кто быстрее справится с тем, чтобы запросить данные за определённый промежуток времени - мускул или КХ?
источник

A

Artem in ClickHouse не тормозит
Александр Артамонов
ну, кароч, планируется таблица айди товара, его позиция, дата проверки. Конечно, она будет в несколько лярдов записей. Кто быстрее справится с тем, чтобы запросить данные за определённый промежуток времени - мускул или КХ?
Джоины будут?
источник

АА

Александр Артамонов... in ClickHouse не тормозит
нет
источник

АА

Александр Артамонов... in ClickHouse не тормозит
будет простой фильтр - дай мне записи товара с этим айдишником за неделю
источник

A

Artem in ClickHouse не тормозит
Александр Артамонов
будет простой фильтр - дай мне записи товара с этим айдишником за неделю
Насколько широкая таблица? Нужно ли получать все данные или только название товара с айдишником, например.
источник

АА

Александр Артамонов... in ClickHouse не тормозит
в ней не будет названия. В ней будет лишь айдишник товара, его позиция(число) и дата вставки. Вот нужно получить позиции товара с определённым айдишником за неделю, например.
источник

A

Artem in ClickHouse не тормозит
Александр Артамонов
в ней не будет названия. В ней будет лишь айдишник товара, его позиция(число) и дата вставки. Вот нужно получить позиции товара с определённым айдишником за неделю, например.
То есть нужно получать все данные из каждой строки или только некоторые? Все столбцовые базы позволяют читать с диска только то, что нужно, а не всю строку. От этого и основное ускорение. Если у вас много столбцов и много записей, но читать нужно только некоторые столбцы за определенный период, то КХ хорошо подходит для такого сценария.
источник

АА

Александр Артамонов... in ClickHouse не тормозит
Я ещё раз извиняюсь за свою ламерность, но ничего не понял( Интересует просто вопрос - что будет быстрее - иннодб или КХ при выборе
   дата -> позиция
из таблицы типа
   ид_товара,позиция, дата
при where запросе ид_товара=2325235, дата больше 7 сентября 2020 года и это при условии что в таблице триллион записей
источник

DC

Denny Crane [not a Y... in ClickHouse не тормозит
Александр Артамонов
Я ещё раз извиняюсь за свою ламерность, но ничего не понял( Интересует просто вопрос - что будет быстрее - иннодб или КХ при выборе
   дата -> позиция
из таблицы типа
   ид_товара,позиция, дата
при where запросе ид_товара=2325235, дата больше 7 сентября 2020 года и это при условии что в таблице триллион записей
innodb
источник

АА

Александр Артамонов... in ClickHouse не тормозит
спасибо
источник

DC

Denny Crane [not a Y... in ClickHouse не тормозит
Александр Артамонов
спасибо
хотя если индекса нет (ид_товара, дата) , то КХ
источник

АА

Александр Артамонов... in ClickHouse не тормозит
а я правильно понимаю что для каждого товара кх будет файлик на диске создавать?
источник

DC

Denny Crane [not a Y... in ClickHouse не тормозит
Александр Артамонов
а я правильно понимаю что для каждого товара кх будет файлик на диске создавать?
нет, какая вам разница как на диске это будет хранится?
КХ быстрее чем iinodb при запросах select sum() group by ид_товара , если товаров например 100 млн. и в таблице миллиард записей
источник

АА

Александр Артамонов... in ClickHouse не тормозит
о! Сразу бы так) Спасибо ещё раз!
источник

IB

Ilya Braslavskiy in ClickHouse не тормозит
А есть какой-нибудь бенчмарк, что кликхаусу становится хреново по ресурсы и ему нужно докидывать оперативу/ядер?
источник

DC

Denny Crane [not a Y... in ClickHouse не тормозит
Александр Артамонов
о! Сразу бы так) Спасибо ещё раз!
т.е. КХ для запросов с группировкой по таблицам сотнями миллиардов записей

скажем у  меня  в одном проекте в таблице 700млрд записей, на 10 серверах и занимает это 200TB диска, потому что записи очень широкие, сотни жирных колонок
источник

DC

Denny Crane [not a Y... in ClickHouse не тормозит
Ilya Braslavskiy
А есть какой-нибудь бенчмарк, что кликхаусу становится хреново по ресурсы и ему нужно докидывать оперативу/ядер?
нету, вопрос дурацкий. Если пользователи не стонут, значит не пора
источник

Е

Егор in ClickHouse не тормозит
привет! подскажите как построить запрос

есть таблица
date, geo, user_id, visits

пример записей
2020-09-14, RU, 123, 100
2020-09-14, UA, 123, 60
2020-09-14, RU, 456, 50

нужно получить топ юзеров по визитам и их топ 5 гео
результат по данным выше:

123, 160, [RU,UA]
456, 50, [RU]

не нашел аналогов group concat из mysql
источник

l

lnuynxa in ClickHouse не тормозит
SELECT groupArray(geo), sum(visits) GROUP BY user_id
источник

AK

Alex Krash in ClickHouse не тормозит
groupArray
источник