Size: a a a

ClickHouse не тормозит

2020 September 17

D

Dmitry Koreckiy in ClickHouse не тормозит
Всем доброй ночи :)
Кто сможет подсказать по clickhouse-backup?
Есть бекап, необходимо заресториться и провести некоторые манипуляции с данными (вставить, удалить и тд)
Не зафакапится ли из-за этого сам бекап?
источник
2020 September 18

O

Ovseiko in ClickHouse не тормозит
Добрый день, если у меня в ch 100 полей, а заполняются в основном 5-10, есть ли разница ощутимая в производительности при заполнении в запросах ниже? Разница в указании пустых полей

INSERT INTO table (field1, field2, fileld3) VALUES("1", "Vasya", "Ten")

INSERT INTO table (field1, field2, fileld3, field4, filed5, field6, field7, ...) VALUES("1", "Vasya", "Ten", "", "", "", "", ...)
источник

CN

Cybernetic Neuron in ClickHouse не тормозит
Привет, я так понимаю, WHERE по группированным агрегированным полям можно делать только через подзапрос?
источник

DT

Dmitry Titov in ClickHouse не тормозит
Cybernetic Neuron
Привет, я так понимаю, WHERE по группированным агрегированным полям можно делать только через подзапрос?
HAVING
источник

CN

Cybernetic Neuron in ClickHouse не тормозит
О, спасибо
источник

CN

Cybernetic Neuron in ClickHouse не тормозит
А это сильно отличается от подзапроса по производительности?
источник

DT

Dmitry Titov in ClickHouse не тормозит
Cybernetic Neuron
А это сильно отличается от подзапроса по производительности?
Ну должно быть быстрее, чем подзапрос думаю
источник

VK

Vladimir K. in ClickHouse не тормозит
Всем привет. Кто-нибудь пробовал через pandahouse вставлять данные в колонку с типом fixedstring?
Я в питоне вычисляю md5 для строки и потом хочу его вставить в эту колонку.

При вставке он пишет, что длина строки больше заданной (у меня fixedstring(16)).
Однако, если посчитать в питоне размер:
hashlib.md5('test'.encode('UTF-8')).digest_size
Он будет равен 16

И я не могу понять, либо я тип на вход неправильный подаю (там 'bytes'), либо pandahouse для этой задачи не подходит
источник

K

Kid in ClickHouse не тормозит
Добрый день. Нормально поведение, что к 1 таблице 2 any left join сильно тормозят выборку.  1 any left join работает нормально
источник

D

Dj in ClickHouse не тормозит
Kid
Добрый день. Нормально поведение, что к 1 таблице 2 any left join сильно тормозят выборку.  1 any left join работает нормально
ну быстрее точно быть не должно )
попробуйте порядок поменять, без деталей сложно что сказать
источник

D

Dj in ClickHouse не тормозит
Ovseiko
Добрый день, если у меня в ch 100 полей, а заполняются в основном 5-10, есть ли разница ощутимая в производительности при заполнении в запросах ниже? Разница в указании пустых полей

INSERT INTO table (field1, field2, fileld3) VALUES("1", "Vasya", "Ten")

INSERT INTO table (field1, field2, fileld3, field4, filed5, field6, field7, ...) VALUES("1", "Vasya", "Ten", "", "", "", "", ...)
если в разных строках разные поля однозначно второй вариант, чтобы одним инсертом все вставить.

а так, я не пробовал... надо тестить на большом кол-ве строк, но +/- должно быть одинаково
источник

K

Kid in ClickHouse не тормозит
Dj
ну быстрее точно быть не должно )
попробуйте порядок поменять, без деталей сложно что сказать
левая таблица 700кк записей, 1 правая 45к, 2 правая 300 строк
источник

D

Dj in ClickHouse не тормозит
Vladimir K.
Всем привет. Кто-нибудь пробовал через pandahouse вставлять данные в колонку с типом fixedstring?
Я в питоне вычисляю md5 для строки и потом хочу его вставить в эту колонку.

При вставке он пишет, что длина строки больше заданной (у меня fixedstring(16)).
Однако, если посчитать в питоне размер:
hashlib.md5('test'.encode('UTF-8')).digest_size
Он будет равен 16

И я не могу понять, либо я тип на вход неправильный подаю (там 'bytes'), либо pandahouse для этой задачи не подходит
может она вставляется двухбайтным уникодом или где-то баг? попробуйте сдампить в файл
источник

D

Dj in ClickHouse не тормозит
Kid
левая таблица 700кк записей, 1 правая 45к, 2 правая 300 строк
sdelayte tak:
select x from left join (sellect t1 left join t2)
источник

D

Dj in ClickHouse не тормозит
Kid
левая таблица 700кк записей, 1 правая 45к, 2 правая 300 строк
так сначала сделается то что в скобках, а потом уже большая таблица будет джойнится
источник

K

Kid in ClickHouse не тормозит
Dj
sdelayte tak:
select x from left join (sellect t1 left join t2)
забыл сказать, что 1 правая по двум полям джойнится, а 2 правая по 1
источник

l

lnuynxa in ClickHouse не тормозит
Kid
забыл сказать, что 1 правая по двум полям джойнится, а 2 правая по 1
Какая версия кх?
источник

K

Kid in ClickHouse не тормозит
lnuynxa
Какая версия кх?
источник

l

lnuynxa in ClickHouse не тормозит
вообще в 20.4 вроде добавили multiple_join_rewriter=2 он чутка умнее
источник

D

Dj in ClickHouse не тормозит
Kid
забыл сказать, что 1 правая по двум полям джойнится, а 2 правая по 1
недостаточно минералов информации... но это не суть, можете join делать, проблемы не вижу
источник