D
ну когда у тебя 100 категорий, руками не прикольно писать)
Size: a a a
D
DK
CREATE TABLE eventsОсновная задача - считать количество уникальных UserId за диапазон времени фильтруя по EventName и при необходимости дополнительно по *другим колонкам* и выводить на график с разбивкой по часу. Например:
(
Timestamp DateTime default now(),
EventName LowCardinality(String),
UserId UUID default generateUUIDv4(),
/* другие колонки */
)
engine = MergeTree()
PARTITION BY (toYYYYMM(Timestamp), EventName)
ORDER BY (Timestamp, EventName)
SELECTРешение в таком виде работает, но колонка UserId съедает в 10ки раз больше места, чем оставшиеся 10ки колонок. Но подозреваю, что использование UUID для моих целей может привести к деградации производительности со временем, т.к. придется читать "жирную" колонку с диска.
(intDiv(toUInt32(Timestamp), 3600) * 3600) * 1000 AS timestamp,
countIf(DISTINCT UserId, EventName = 'finish') / countIf(DISTINCT UserId, EventName = 'start') AS ratio
FROM events
WHERE Timestamp > 1612781916
GROUP BY timestamp
ORDER BY timestamp
DC
with (select ['key1','key2','key3'] as arr) as all_keys
select
id,
arrayElement(groupArrayInsertAt(Null, 3)(tuple(toNullable(v)), toUInt32(indexOf(all_keys, k) - 1)).1 as values, 1) as key1,
values[2] as key2, values[3] as key3
from
(
select * from (
select arrayJoin([1,2,3]) as id, arrayJoin(['key1','key2','key3']) as k, cityHash64(id, k)%10 as v) /* random filter*/
where v>4
)
group by id;
SELECT untuple((1, 2, 3))
┌─_ut_1─┬─_ut_2─┬─_ut_3─┐
│ 1 │ 2 │ 3 │
└───────┴───────┴───────┘
DC
[('a',3),('b',4)]
и на клиенте разодратьD
SELECT untuple((1, 2, 3))
┌─_ut_1─┬─_ut_2─┬─_ut_3─┐
│ 1 │ 2 │ 3 │
└───────┴───────┴───────┘
create table default.tstpivot (id UInt32, k String, v UInt32) Engine=MergeTree order by tuple();
insert into default.tstpivot
select * from (
select arrayJoin([1,2,3]) as id, arrayJoin(['key1','key2','key3']) as k, cityHash64(id, k)%10 as v) /* random filter*/
where v>4 ;
with (select groupArrayDistinct(k) from default.tstpivot) as all_keys, -- здесь заменяем на дистинкт запрос к базе
groupArrayInsertAt(Null, 3)(tuple(toNullable(v)), toUInt32(indexOf(all_keys, k) - 1)).1 as values
select
id,
values
from default.tstpivot
group by id;
DC
CREATE TABLE eventsОсновная задача - считать количество уникальных UserId за диапазон времени фильтруя по EventName и при необходимости дополнительно по *другим колонкам* и выводить на график с разбивкой по часу. Например:
(
Timestamp DateTime default now(),
EventName LowCardinality(String),
UserId UUID default generateUUIDv4(),
/* другие колонки */
)
engine = MergeTree()
PARTITION BY (toYYYYMM(Timestamp), EventName)
ORDER BY (Timestamp, EventName)
SELECTРешение в таком виде работает, но колонка UserId съедает в 10ки раз больше места, чем оставшиеся 10ки колонок. Но подозреваю, что использование UUID для моих целей может привести к деградации производительности со временем, т.к. придется читать "жирную" колонку с диска.
(intDiv(toUInt32(Timestamp), 3600) * 3600) * 1000 AS timestamp,
countIf(DISTINCT UserId, EventName = 'finish') / countIf(DISTINCT UserId, EventName = 'start') AS ratio
FROM events
WHERE Timestamp > 1612781916
GROUP BY timestamp
ORDER BY timestamp
DK
D
SELECT untuple((1, 2, 3))
┌─_ut_1─┬─_ut_2─┬─_ut_3─┐
│ 1 │ 2 │ 3 │
└───────┴───────┴───────┘
DC
D
VB
В
В
DC
В
DC
В
В
DC
В