Size: a a a

ClickHouse не тормозит

2020 August 30

M

Maxim Bogdanov in ClickHouse не тормозит
Denny Crane [not a Yandex bot]
а вместо join-в таблицы ивентов с таблицей юзеров, теперь ssd dictionary
Нашёл смердженную фичу. Интересно. А сколько туда может влезть данных. Так как словари всегда шли с пометкой relatively small
источник

l

lnuynxa in ClickHouse не тормозит
Maxim Bogdanov
Нашёл смердженную фичу. Интересно. А сколько туда может влезть данных. Так как словари всегда шли с пометкой relatively small
Миллионы десятки миллионов терпимо
источник

A

Artem in ClickHouse не тормозит
Maxim Bogdanov
так я ту же таблицу и джойнил 🙂 Задача была - надо было сджойнить два действия пользователя, одно за другим и сделать воронку. Ну а в кликхаусе я думал сджойнить таблицу юзеров и их действий. И там и там PK - это userID.
источник

M

Maxim Bogdanov in ClickHouse не тормозит
lnuynxa
Миллионы десятки миллионов терпимо
Глянул щас код. Так там словарь вроде как звёзд с неба не хватает, его же нельзя юзать, как отдельную таблицу и делать по нему доп. выборки. Допустим, у юзера есть поле Country, и вот хочется его учитывать в запросе. При этом таблица юзеров, как уже все подметили, должна быть OLTP
источник

M

Maxim Bogdanov in ClickHouse не тормозит
Не, очень медленная штука. Тестил на 6млн записях, у скорость около 2сек была. Написал свою имплементацию, на 20млн 500мс скорость на одном ядре 🙂
источник

l

lnuynxa in ClickHouse не тормозит
Maxim Bogdanov
Глянул щас код. Так там словарь вроде как звёзд с неба не хватает, его же нельзя юзать, как отдельную таблицу и делать по нему доп. выборки. Допустим, у юзера есть поле Country, и вот хочется его учитывать в запросе. При этом таблица юзеров, как уже все подметили, должна быть OLTP
Если юзер лежит в словаре, то просто пишешь в WHERE dictGet(users,country,user_id) = Russia
источник

M

Maxim Bogdanov in ClickHouse не тормозит
lnuynxa
Если юзер лежит в словаре, то просто пишешь в WHERE dictGet(users,country,user_id) = Russia
Бенчи бы ещё глянкть. В ишью просили сделать их, но пока видимо нет
источник

l

lnuynxa in ClickHouse не тормозит
Maxim Bogdanov
Бенчи бы ещё глянкть. В ишью просили сделать их, но пока видимо нет
Бенчи на что?
источник

D

Dj in ClickHouse не тормозит
Maxim Bogdanov
Бенчи бы ещё глянкть. В ишью просили сделать их, но пока видимо нет
Bench на словари?
источник

M

Maxim Bogdanov in ClickHouse не тормозит
ну да, почему бы и нет
источник

M

Maxim Bogdanov in ClickHouse не тормозит
это же словари
источник

D

Dj in ClickHouse не тормозит
У словарей проблема только в памяти, жрут как не в себя
источник

M

Maxim Bogdanov in ClickHouse не тормозит
ну вот я и говорю
источник

D

Dj in ClickHouse не тормозит
Ну вы создайте словарь и увидите
источник

D

Dj in ClickHouse не тормозит
Сто кейсов - сто бенчей
источник

l

lnuynxa in ClickHouse не тормозит
Ну из головы, джоин на таблицу в 5 лям + словарь на 50 лям, 32 ядра сервер, ок 100 млн в секунду
источник

l

lnuynxa in ClickHouse не тормозит
Вроде как то так
источник

AK

Andrii Kakoichenko in ClickHouse не тормозит
Denny Crane [not a Yandex bot]
насколько я понимаю на сотнях миллионов юзеров и миллиардах ивентов воронки можно сделать только до заливки в dwh
И как потом это хранить по бест практису? Нумеровать событие в разрезе юзера, чтобы хеш джойном потом воронку строить?
источник

DC

Denny Crane [not a Y... in ClickHouse не тормозит
ssd dictionary все равно похоже медлено, сделал словарь на миллирдной таблице, с 8ГБ кеша, маленькими кусками читает из таблицы, флашит в кеш
источник

M

Maxim Bogdanov in ClickHouse не тормозит
lnuynxa
Ну из головы, джоин на таблицу в 5 лям + словарь на 50 лям, 32 ядра сервер, ок 100 млн в секунду
интересно, спасибо. А почему не наоборот? В смысле не 5млн словарь и 50млн строк. Или так и задумано?
источник