Size: a a a

ClickHouse не тормозит

2020 June 02

OK

Oleg K in ClickHouse не тормозит
Есть тип Nested, в нем можно сделать key-value пары. Почти те же массивы, но по крайней мере со слабой гарантией консистентности: https://clickhouse.tech/docs/ru/sql-reference/data-types/nested-data-structures/nested/
источник

НМ

Никита Макушников... in ClickHouse не тормозит
Привет! Подскажите, есть в Clickhouse возможность ограничения размера таблицы? То есть я могу поставить для таблицы TTL, чтобы ограничить время хранения. А есть ли возможность аналогичной настройки для размера таблицы в гигабайтах?
источник

l

lnuynxa in ClickHouse не тормозит
TTL это скорее пожелание, чем ограничение
источник

DC

Denny Crane (I don't... in ClickHouse не тормозит
Andrey Oleynik
Привет, подскажите как лучше оргинизовать в Clickhouse хранение событий с разными параметрами? Те у них есть общая часть и у каждого что-то свое. Изначально хотелось положить различающиеся параметры в одно поле в виде json, но Clickhouse, как я понял, не позволяет делать выборки по таким колонкам.
Нашел статью от баду, они хранят ключи и значения в массивах, а потом изгаляются и строят графики: (https://habr.com/ru/company/badoo/blog/442616/). Так принято делать? Или есть более правильные варианты?
позволяет, jsonExtract , парсим джейсоны в select, только работает в 1000 раз медленее чем просто колонка
источник

DC

Denny Crane (I don't... in ClickHouse не тормозит
Никита Макушников
Привет! Подскажите, есть в Clickhouse возможность ограничения размера таблицы? То есть я могу поставить для таблицы TTL, чтобы ограничить время хранения. А есть ли возможность аналогичной настройки для размера таблицы в гигабайтах?
нет такой возможности
источник

AO

Andrey Oleynik in ClickHouse не тормозит
Denny Crane (I don't work at Yandex (never did))
позволяет, jsonExtract , парсим джейсоны в select, только работает в 1000 раз медленее чем просто колонка
Ок, а как делать правильно?) Создавать таблицу для каждого события?
источник

DC

Denny Crane (I don't... in ClickHouse не тормозит
Dmitry Vasiliev
есть банальная таблица с (time, http_code, http_path, …)
хочется сделать count по времени и вывести top50 http_path, какие функции у clickhouse могут помочь?
что такое "count по времени" ?

select count() с, http_path
...
group by http_path
order by c desc
limit 50
источник

M

Melchizedek in ClickHouse не тормозит
Ребят, привет.

Хотел спросить по поводу алгоритма выполнения функции toStartOfInterval. Может быть кто-нибудь сталкивался.

Обратил внимание, что для третьей недели сбивается группа и возвращается не первый день первой недели.

Первый день первой недели, на сколько понимаю, должен быть 2019-12-30.

Опять-таки, если и вернул 2019-12-23, то почему на следующих вычислениях повторяется возврат той же даты только один раз.

Мне казалось, что правильным бы было вернуть три раза подряд 2019-12-23.
источник

M

Melchizedek in ClickHouse не тормозит
Запрос:

select addWeeks(toDateTime('2020-01-02 02:15:22'), number) as dttm,
      toInt8(formatDateTime(dttm, '%V'))       wn,
      toStartOfInterval(dttm, interval 1 week) w1,
      toStartOfInterval(dttm, interval 2 week) w2,
      toStartOfInterval(dttm, interval 3 week) w3,
      toStartOfInterval(dttm, interval 4 week) w4
 from numbers(12)
order by dttm
;
источник

DC

Denny Crane (I don't... in ClickHouse не тормозит
Andrey Oleynik
Ок, а как делать правильно?) Создавать таблицу для каждого события?
просто таблица с 800 колонками, там все события, всех типов
источник

DV

Dmitry Vasiliev in ClickHouse не тормозит
Denny Crane (I don't work at Yandex (never did))
что такое "count по времени" ?

select count() с, http_path
...
group by http_path
order by c desc
limit 50
count по времени во временном интервале: group by t где t - например округление до минуты/часа/..
источник

DC

Denny Crane (I don't... in ClickHouse не тормозит
Dmitry Vasiliev
count по времени во временном интервале: group by t где t - например округление до минуты/часа/..
и что для каждого часа надо топ50?


select count() с, http_path, toStartOfHour(time) h
...
group by http_path,h
order by h, c desc
limit 50 by h
источник

DV

Dmitry Vasiliev in ClickHouse не тормозит
Denny Crane (I don't work at Yandex (never did))
и что для каждого часа надо топ50?


select count() с, http_path, toStartOfHour(time) h
...
group by http_path,h
order by h, c desc
limit 50 by h
Ок поясню, строю график по времени. Нужно отсечь рандомный мусор. Сейчас отсекаю через having count > N, хочется весь отсечённый мусор показать как overs
источник

D

Dmitry Koreckiy in ClickHouse не тормозит
Dmitry Vasiliev
Ок поясню, строю график по времени. Нужно отсечь рандомный мусор. Сейчас отсекаю через having count > N, хочется весь отсечённый мусор показать как overs
не подойдет?
group by field1…fieldn with totals
источник

DC

Denny Crane (I don't... in ClickHouse не тормозит
Melchizedek
Ребят, привет.

Хотел спросить по поводу алгоритма выполнения функции toStartOfInterval. Может быть кто-нибудь сталкивался.

Обратил внимание, что для третьей недели сбивается группа и возвращается не первый день первой недели.

Первый день первой недели, на сколько понимаю, должен быть 2019-12-30.

Опять-таки, если и вернул 2019-12-23, то почему на следующих вычислениях повторяется возврат той же даты только один раз.

Мне казалось, что правильным бы было вернуть три раза подряд 2019-12-23.
трехнедельный интервал начался не 30, а 23, все правильно работает
источник

DV

Dmitry Vasiliev in ClickHouse не тормозит
Dmitry Koreckiy
не подойдет?
group by field1…fieldn with totals
With totals, заценю, спасибо!
источник

DC

Denny Crane (I don't... in ClickHouse не тормозит
Dmitry Vasiliev
Ок поясню, строю график по времени. Нужно отсечь рандомный мусор. Сейчас отсекаю через having count > N, хочется весь отсечённый мусор показать как overs
пипец вы обсъяняете, как будто с инопланетянами общение
нихера не понял
источник

DV

Dmitry Vasiliev in ClickHouse не тормозит
Denny Crane (I don't work at Yandex (never did))
пипец вы обсъяняете, как будто с инопланетянами общение
нихера не понял
Сорян, кинул бы sql, но не за ноутом. Спасибо!
источник

M

Melchizedek in ClickHouse не тормозит
Denny Crane (I don't work at Yandex (never did))
трехнедельный интервал начался не 30, а 23, все правильно работает
Спасибо.

Получается, что расчет интервалов начинается с 1970 года
источник

M

Melchizedek in ClickHouse не тормозит
поэтому и значения разные могут быть.
источник