Посидел немного над статистикой чатов в Телеграм на примере
@seochat Виктора Каргина.
Это мы все вокруг новой статистики танцуем и смотрим, что будет полезно знать и с чем сравнивать.
Несмотря на то, что число участников чата выросло с 100 примерно в начале измеряемого массива (2 мая 2016) до 2500+ в конце (февраль 2017), в целом сообщество саморегулируется.
На первой картинке (по X порядковый номер недели, по Y средний темп сообщений) - медиана среднего количества сообщений в день, она практически не растет, сколько бы юзеров в чате не было. Пики - скорее всего, новые массовые вливания в чат, но это мы будем определять еще (собственно, определение событий в чатах по отклонениям и есть то, что я хочу сделать). Медиана тут примерно 33,5 сообщений в час.
На второй картинке распределение активности по часам. В целом, почасовая медиана (по overall истории чата) близка к 38 сообщениям в час.
Штоэтазначит на практике:
- Неважно, 20 человек в чате, или 2000, это в обычном режиме не превращается в безудержный флуд. Темп не превышает 1 сообщения в минуту, в норме.
- по отклонениям от темпа (а их внутри есть!) для конкретного дня явно можно судить о "горячих" темах или вливаниях аудитории, а для отклонений от темпа внутри конкретного часа - о яростных обсуждениях.
Следующим этапом будем ловить эти самые горячие темы.