Size: a a a

ClickHouse не тормозит

2020 May 19

DC

Denny Crane (I don't... in ClickHouse не тормозит
bytes_on_disk data_compressed_bytes data_uncompressed_bytes -- это тоже самое что и в system.parts
источник

DC

Denny Crane (I don't... in ClickHouse не тормозит
Artem
SELECT 
   partition,
   column,
   sum(data_compressed_bytes) AS sz
FROM system.parts_columns
WHERE (partition = '202004') AND (table = 'impressions') AND active
GROUP BY
   partition,
   column
ORDER BY sz DESC


Все равно сумма такая как будто group by не написан получается
column_data_compressed_bytes column_data_uncompressed_bytes
column_bytes_on_disk
источник

A

Artem in ClickHouse не тормозит
Denny Crane (I don't work at Yandex (never did))
bytes_on_disk data_compressed_bytes data_uncompressed_bytes -- это тоже самое что и в system.parts
ага, теперь оно, спс
SELECT 
   partition,
   column,
   formatReadableSize(sum(column_bytes_on_disk) as sz)
FROM system.parts_columns
WHERE (partition = '202004') AND (table = 'impressions') AND active
GROUP BY
   partition,
   column
ORDER BY sz DESC
источник

A

Artem in ClickHouse не тормозит
мда, только упорядочивать надо не по отформатированному)
источник

A

Artem in ClickHouse не тормозит
думал там есть оверрайд сортировки по отформатированным размерам, оказалось просто по строкам
источник

DC

Denny Crane (I don't... in ClickHouse не тормозит
Artem
ага, теперь оно, спс
SELECT 
   partition,
   column,
   formatReadableSize(sum(column_bytes_on_disk) as sz)
FROM system.parts_columns
WHERE (partition = '202004') AND (table = 'impressions') AND active
GROUP BY
   partition,
   column
ORDER BY sz DESC
formatReadableSize(sum(column_bytes_on_disk) as x) AS sz
...
ORDER BY x DESC
источник

DC

Denny Crane (I don't... in ClickHouse не тормозит
какой еще оверрайд, это обычный sql, получили строку на выходе функции, сотрируем по строке
источник

A

Artem in ClickHouse не тормозит
Мало ли это дополненный sql, а formatReadableSize возвращает не обычную строку, а тип Строка-размер. Всякое бывает)
источник

МП

Модина Питон... in ClickHouse не тормозит
добрейшего  времени суток, кто-то пробовал использовать таблицы в clickHouse чтобы оттуда продюсить  данные в топики kafka? через что лучше реализовывать такое?
источник

DC

Denny Crane (I don't... in ClickHouse не тормозит
Модина Питон
добрейшего  времени суток, кто-то пробовал использовать таблицы в clickHouse чтобы оттуда продюсить  данные в топики kafka? через что лучше реализовывать такое?
непонятно про что вопрос. КХ engine=Kafka умеет быть продьюсером, просто делаете insert into kafka_table select * from other_table
источник

МП

Модина Питон... in ClickHouse не тормозит
Denny Crane (I don't work at Yandex (never did))
непонятно про что вопрос. КХ engine=Kafka умеет быть продьюсером, просто делаете insert into kafka_table select * from other_table
тьфу.. чет проглядел это, спасибо!
источник

ДК

Дмитрий Ковалёв... in ClickHouse не тормозит
Всем доброго времени суток. Люди, подскажите, как вы парсите user_agent?) Собираем access логи nginx с балансеров в кх, ua в строке. Захотелось собственной аналитики по используемым браузерам - не знаем, как было бы правильней обработать поле
источник

YV

Yuri Velgosha in ClickHouse не тормозит
Дмитрий Ковалёв
Всем доброго времени суток. Люди, подскажите, как вы парсите user_agent?) Собираем access логи nginx с балансеров в кх, ua в строке. Захотелось собственной аналитики по используемым браузерам - не знаем, как было бы правильней обработать поле
У нас DBA в своё время просто справочник сделали и при засасывании логов меняли найденный UA на его ID. Но это SQL-way.. В кх типа нету полноценного FullText index'a, но многие уже реализовали что-то похожее. Тут можно попробовать поискать.
источник

A

Andrey in ClickHouse не тормозит
Дмитрий Ковалёв
Всем доброго времени суток. Люди, подскажите, как вы парсите user_agent?) Собираем access логи nginx с балансеров в кх, ua в строке. Захотелось собственной аналитики по используемым браузерам - не знаем, как было бы правильней обработать поле
Есть много разных библиотек на том же гитхабе для парсинга юзер агента.)
источник

ДК

Дмитрий Ковалёв... in ClickHouse не тормозит
Yuri Velgosha
У нас DBA в своё время просто справочник сделали и при засасывании логов меняли найденный UA на его ID. Но это SQL-way.. В кх типа нету полноценного FullText index'a, но многие уже реализовали что-то похожее. Тут можно попробовать поискать.
Интересное решение. Но словарь же весьма здоровый получится...
источник

AP

Abi Palagashvili in ClickHouse не тормозит
А имеется ли возможность сделать синхронный alter table?
Мне надо дропнуть партицию и заново налить её, хочу убедиться, что новые данные не попадут под действие drop partition
источник

C

Cargeh in ClickHouse не тормозит
Abi Palagashvili
А имеется ли возможность сделать синхронный alter table?
Мне надо дропнуть партицию и заново налить её, хочу убедиться, что новые данные не попадут под действие drop partition
detach и дропнуть вручную?
источник

ДК

Дмитрий Ковалёв... in ClickHouse не тормозит
Andrey
Есть много разных библиотек на том же гитхабе для парсинга юзер агента.)
С учетом того, что у нас уже парсингом и инсертами занимается go, самое очевидное решение - прикрутить туда же готовый uap-go) Я просто не уверен в правильности этого решения, так как во всех примерах в кх пишется полная строка ua, а так же он существенно замедляет работу сервиса
источник

AP

Abi Palagashvili in ClickHouse не тормозит
Cargeh
detach и дропнуть вручную?
в смысле, после detach можно сделать асинронный drop, а там временем начать наливать?
источник

AP

Abi Palagashvili in ClickHouse не тормозит
в целом я нашел replication_alter_partitions_sync, но идея клевая
источник