Size: a a a

R (язык программирования)

2021 June 23

AS

Alexander Semenov in R (язык программирования)
Уважаемые, подскажите правильных слов для гугления под такую задачу: сейчас параллельно идут стримы квалификаций к TI10 от 2х студий (по 2 стрима у каждой студии, т.е. всего 4). Каждая пара стримов кажет одни и те же матчи. Есть возможность получить временной ряд кол-ва зрителей этих трансляций, дёргая API раз в минуту. Таким образом хочется понять эффект, который оказывают на кол-во зрителей комментаторы матчей.
источник

AS

Alexander Semenov in R (язык программирования)
Т.е. мы видим 2 временных ряда, каждый из которых соответствует кол-ву зрителей одних и тех же матчей у разных студий. Можно ли из этих данных как-то сказать, что определённый гость в студии или комментатор на трансляции были особо удачными/тошными?
источник

АЧ

Артем Черемухин... in R (язык программирования)
Мне кажется, тут и гуглить особо нечего. Просто временной ряд, на который (возможно) влияет какая-то переменная. Вот здесь посмотрите https://ranalytics.github.io/tsa-with-r/ch-intro-to-prophet.html#sec-prophet-predictors
источник

AS

Alexander Semenov in R (язык программирования)
Спасибо. Эта глава у меня в открытых вкладках висит прямо сейчас (уже давно). Но почему-то не до конца матчится у меня prophet с задачей.
источник

AS

Alexander Semenov in R (язык программирования)
Т.е. расчёт корреляции 2х временных кажется одним из шагов в решении задачи, но не единственным.
источник

АЧ

Артем Черемухин... in R (язык программирования)
Почему? Сделайте много дамми-переменных (например, 1 - значит комментирует Вилат, 0 - нет) и стройте уравнение регрессии
источник

AS

Alexander Semenov in R (язык программирования)
Мы, например, можем увидеть, что в течение дня корреляция составляла определённое значение, но, например, с 14:00 до 15:00 на мейнкасте комментил богомерзкий Киевстонер, что вызвало отток аудитории мейнкаста на рухаб на этот период.

В принципе, написав это, я понимаю, что подобное можно и просто глазами увидеть по 2м графикам.
источник

IY

Igor Yegin in R (язык программирования)
Корреляция нестационарных временных рядов — некорректная процедура
источник

IY

Igor Yegin in R (язык программирования)
Вместо этого нужно проводить коинтеграционный анализ
источник

АЧ

Артем Черемухин... in R (язык программирования)
Ну можно другую меру близости использовать. То же самое dtw-расстояние?
источник

AS

Alexander Semenov in R (язык программирования)
Вот это уже похоже на словосочетание, которого я не знаю, и требующее гугления.
источник

AS

Alexander Semenov in R (язык программирования)
Во, хорошо пошло!
источник

АЧ

Артем Черемухин... in R (язык программирования)
Так это в той же книге, просто на 3 главы дальше...
источник

IY

Igor Yegin in R (язык программирования)
Посмотрите пакет egcm
источник

AS

Alexander Semenov in R (язык программирования)
Я ещё думал в сторону пакета, которым в х5 оценивали эффект продаж пива во время чемпионата по футболу. Забыл, как называется. С байесовщиной какой-то.
источник

AI

Anton I in R (язык программирования)
Вроде Causal Impact? Но он больше про аплифт после влияния определенного фактора

https://google.github.io/CausalImpact/CausalImpact.html
источник

AI

Anton I in R (язык программирования)
А про сравнение временных рядов - это dynamic time warping, который выше посоветовали. Но он сравнивает ряды со смещением во времени, если надо соответствующие во времени ряды сравнить - то евклидово расстояние
источник

AS

Alexander Semenov in R (язык программирования)
Его и ещё второй какой-то. Там вроде аббревиатура была из 4х букв.
источник

AI

Anton I in R (язык программирования)
Bsts package, про байесовские структурные временные ряды
источник

AS

Alexander Semenov in R (язык программирования)
Во-во, именно оно!
источник