Size: a a a

R (язык программирования)

2021 March 05

AS

Alexander Semenov in R (язык программирования)
Григорий Демин
пусть у нас есть x>=1, плотность вероятности x  p(x) = 1/x^2 - мат. ожидание не существует. Я подозреваю, что у меня на работе выручка каждого юнита именно так распределена:) но проверять эту гипотезу боюсь)
Всё началось с "невинного" вопроса: почему не стоит АБ-тестом мерить выручку с элемента на странице (полка с фильмами). Сходу я на него ответить не смог, т.к. особых проблем не увидел. Выяснилось, что человек ожидал ответа: распределение выручки сильно скошено => нужен другой стат. критерий.
источник

IY

Igor Yegin in R (язык программирования)
Григорий Демин
пусть у нас есть x>=1, плотность вероятности x  p(x) = 1/x^2 - мат. ожидание не существует. Я подозреваю, что у меня на работе выручка каждого юнита именно так распределена:) но проверять эту гипотезу боюсь)
Делаете Probability integral transform, а далее какой-нибудь критерий равномерности. Это несложно, вроде бы
источник

AS

Alexander Semenov in R (язык программирования)
Предложение прологарифмировать и на результате считать как по нормальному распределению от него прозвучало =)
источник

IY

Igor Yegin in R (язык программирования)
Alexander Semenov
Предложение прологарифмировать и на результате считать как по нормальному распределению от него прозвучало =)
Не лучший вариант. Если исходное распределение не логнормальное, то всё равно придётся проверять на нормальность
источник

ГД

Григорий Демин... in R (язык программирования)
Igor Yegin
Делаете Probability integral transform, а далее какой-нибудь критерий равномерности. Это несложно, вроде бы
Проверить на распределение? Это-то не сложно... Но вдруг действительно окажется, что не существует мат ожидания. И как дальше аналитику делать?:)
источник

ГД

Григорий Демин... in R (язык программирования)
Alexander Semenov
Предложение прологарифмировать и на результате считать как по нормальному распределению от него прозвучало =)
Таким способом мы сравним геометрические средние (x1*x2*.. * xn)^(1/n)
источник

IY

Igor Yegin in R (язык программирования)
Григорий Демин
Проверить на распределение? Это-то не сложно... Но вдруг действительно окажется, что не существует мат ожидания. И как дальше аналитику делать?:)
Робастные оценки среднего?

Хотя, наверное, вопрос ироничный. Извините, у меня эмоциональный интеллект низкий
источник

PU

Philipp Upravitelev in R (язык программирования)
пилите бутстрапы, что тут еще сказать можно. хотя если нет мат.ожидания или бесконечная дисперсия, то тоска. и надо принимать волевое решение @@
источник

IY

Igor Yakubovskiy in R (язык программирования)
Бутстрапы - наше все
источник

IY

Igor Yegin in R (язык программирования)
А разве даже при неопределённости матожидания и дисперсии нельзя применять ранговые критерии?
источник

IY

Igor Yakubovskiy in R (язык программирования)
Да кстати, ранговые ведь можно
Там плевать на мат ожидание
источник

AS

Alexander Semenov in R (язык программирования)
Philipp Upravitelev
пилите бутстрапы, что тут еще сказать можно. хотя если нет мат.ожидания или бесконечная дисперсия, то тоска. и надо принимать волевое решение @@
Поговаривают, что это больно для прода.
источник

IY

Igor Yegin in R (язык программирования)
К слову, в исторических исследованиях чаще именно их и используют, так как фиг поймёшь, как распределены налоговые, результаты выборов и т.п.
источник

PU

Philipp Upravitelev in R (язык программирования)
Igor Yegin
А разве даже при неопределённости матожидания и дисперсии нельзя применять ранговые критерии?
не всегда. если у вас всего несколько вариантов ответов респондентов (например, пять цен), то ранговые критерии будут сбоить - слишком много значений будет с одним рангом.
источник

PU

Philipp Upravitelev in R (язык программирования)
к слову. кто что хорошее знает для статичной отрисовки облака слов?
я помню, что был wordcloud, но есть у меня сомнения по его поводу, вроде как он дурной местами
источник

IY

Igor Yegin in R (язык программирования)
Philipp Upravitelev
не всегда. если у вас всего несколько вариантов ответов респондентов (например, пять цен), то ранговые критерии будут сбоить - слишком много значений будет с одним рангом.
Если вариантов мало, то хи-квадрат
источник

AS

Alexander Semenov in R (язык программирования)
Philipp Upravitelev
к слову. кто что хорошее знает для статичной отрисовки облака слов?
я помню, что был wordcloud, но есть у меня сомнения по его поводу, вроде как он дурной местами
Всю жизнь пользовал wordle. Для мака на java есть даже приложение.
источник

ГД

Григорий Демин... in R (язык программирования)
Igor Yegin
А разве даже при неопределённости матожидания и дисперсии нельзя применять ранговые критерии?
Наверное, можно. Но ранговые критерии сравнивают не среднее, а что-то свое, больше всего похоже на медиану. Грубо говоря, сравнивают, средний ранг.
источник

PU

Philipp Upravitelev in R (язык программирования)
Alexander Semenov
Всю жизнь пользовал wordle. Для мака на java есть даже приложение.
у меня линукс и данные в R %(
источник

PU

Philipp Upravitelev in R (язык программирования)
Григорий Демин
Наверное, можно. Но ранговые критерии сравнивают не среднее, а что-то свое, больше всего похоже на медиану. Грубо говоря, сравнивают, средний ранг.
я видел симпатичную формулировку, что это проверка на сдвиг распределения. а медианы лишь наиболее показательный случай %)
источник