Size: a a a

ClickHouse не тормозит

2021 January 18

M

Mishanya in ClickHouse не тормозит
Ivan
Други, помогите плз) Есть таблица с логами заходов пользователей(1 запись = 1 действие). Нужно сгруппировать по дате и посчитать кол-во активных пользователей по датам. Активный - это тот кто заходил хотябы раз за 2 недели, тоесть есть хотя бы одна запись) Как на клике это лучше всего посчитать?
не уверен, но
select count(active) as alias 

group by date
having alias > 1

возможно даже в селект не нужно пихать, а сразу в хевинг, но это не точно)

или в подзапрос обернуть, так точно работать будет)
источник

K

KiLEX 萊赫 in ClickHouse не тормозит
Mishanya
не уверен, но
select count(active) as alias 

group by date
having alias > 1

возможно даже в селект не нужно пихать, а сразу в хевинг, но это не точно)

или в подзапрос обернуть, так точно работать будет)
+ сгрупировать по ид пользователя или какойто признак уникальности
источник

M

Mishanya in ClickHouse не тормозит
KiLEX 萊赫
+ сгрупировать по ид пользователя или какойто признак уникальности
точно
источник

K

KiLEX 萊赫 in ClickHouse не тормозит
uniq(userid)
источник

M

Mishanya in ClickHouse не тормозит
если нужен тотал по всем прям - можно попробовать в группировку докинуть with totals
источник

I

Ivan in ClickHouse не тормозит
Эммм. Это будет просто кол-во в эти дни, а должно быть например в сегодня попадут только те кто заходил сегодян или в оконо 2 недели назад. И так на каждый день)
источник

K

KiLEX 萊赫 in ClickHouse не тормозит
Ivan
Эммм. Это будет просто кол-во в эти дни, а должно быть например в сегодня попадут только те кто заходил сегодян или в оконо 2 недели назад. И так на каждый день)
написано было что заходил хотябы раз
источник

I

Ivan in ClickHouse не тормозит
Сорри поправил на или)
источник

K

KiLEX 萊赫 in ClickHouse не тормозит
значит запись текущего дня как раз гарантирует активность
источник

I

Ivan in ClickHouse не тормозит
KiLEX 萊赫
значит запись текущего дня как раз гарантирует активность
Верно, но если ее сегодня нет, а 11 дней назад есть, то и сегодня он дожен поасть в активные)
источник

K

KiLEX 萊赫 in ClickHouse не тормозит
правильно я понимаю. вот например пустой лог. приходит один чел - и мы должны в агрегации получить что есть один активный чел ровно 2 недели от его захода и потом нули?
источник

K

KiLEX 萊赫 in ClickHouse не тормозит
сагрегируй до двухнедельных отрезков)
источник

I

Ivan in ClickHouse не тормозит
KiLEX 萊赫
правильно я понимаю. вот например пустой лог. приходит один чел - и мы должны в агрегации получить что есть один активный чел ровно 2 недели от его захода и потом нули?
Не очень тебя понял) В итогде должна быть табличка с 2мя колонками, дата и кол-во активных пользователей.
источник

K

KiLEX 萊赫 in ClickHouse не тормозит
а исходя из какой логики в дне должен учитываться пользователь который последний раз заходил две недели назад?)
источник

K

KiLEX 萊赫 in ClickHouse не тормозит
просто чтобы было больше количественно?)
источник

I

Ivan in ClickHouse не тормозит
Ну типо если есть хотя бы 1 тык приложении 2 недели назад(это 1 строчка в этой таблице), то он сегодня опадет в активные, а завтра нет(если он сегодня или завтра не зайдет соответственно))
источник

K

KiLEX 萊赫 in ClickHouse не тормозит
такое ощущение что ничего лучше не будет чем циклом в коде пробежаться по всем дням искомого периода и выбрать уникальных визиторов за последние две недели… ну или через какую нить временную таблицу…
источник

K

KiLEX 萊赫 in ClickHouse не тормозит
Ivan
Ну типо если есть хотя бы 1 тык приложении 2 недели назад(это 1 строчка в этой таблице), то он сегодня опадет в активные, а завтра нет(если он сегодня или завтра не зайдет соответственно))
но никакой логики в этом нет же?)
источник

K

KiLEX 萊赫 in ClickHouse не тормозит
бизнес логики
источник

K

KiLEX 萊赫 in ClickHouse не тормозит
посчитайте уники по дням, посчитайте уники по неделям
источник