Size: a a a

R (язык программирования)

2020 September 12

EP

Ed P in R (язык программирования)
Andrey
тогда это не АБ тест, а просто какие-то бессмысленные манипуляции
почему? М.б. ответ на вопрос о равенстве винрейта в разных группах. У одной он 65%, а у другой 66% - это важное различие или нет?
источник

A

Andrey in R (язык программирования)
Ed P
почему? М.б. ответ на вопрос о равенстве винрейта в разных группах. У одной он 65%, а у другой 66% - это важное различие или нет?
Важность различий ничего общего со статической значимостью не имеет
источник

AS

Alexander Semenov in R (язык программирования)
Andrey
В тестах - не бессмысленная эта проверка. Но сравнение на всех юзерах тестом не является.
Вот поэтому я и спрашивал: если половина ВСЕХ посетителей сайта за период видела одно, а другая половина -- другое, в чём (философский) смысл стат. значимости результатов сравнения этих 2х групп.
источник

EP

Ed P in R (язык программирования)
ну в смысле стат значимое или нет. речь не о magnitude
источник

A

Andrey in R (язык программирования)
Ed P
ну в смысле стат значимое или нет. речь не о magnitude
а какая разница, есть или нет, если эти выводы некуда распространить (вся совокупность уже в тесте)?
источник

A

Andrey in R (язык программирования)
Alexander Semenov
Вот поэтому я и спрашивал: если половина ВСЕХ посетителей сайта за период видела одно, а другая половина -- другое, в чём (философский) смысл стат. значимости результатов сравнения этих 2х групп.
ни в чем, и АБ тестом это называть не надо
источник

ГД

Григорий Демин... in R (язык программирования)
Alexander Semenov
Вот поэтому я и спрашивал: если половина ВСЕХ посетителей сайта за период видела одно, а другая половина -- другое, в чём (философский) смысл стат. значимости результатов сравнения этих 2х групп.
Тут есть момент, что исследуемый результат скорее всего генерируется случайным процессом. И у того процесса есть шум. И хотелось бы знать параметры этого шума, чтобы понять действительно есть разница или это просто случайность.
источник

AS

Alexander Semenov in R (язык программирования)
Andrey
ни в чем, и АБ тестом это называть не надо
Я, конечно, опрос не проводил, что что-то мне подсказывает, что большинство людей именно так его и понимает/реализует.
источник

AS

Alexander Semenov in R (язык программирования)
Григорий Демин
Тут есть момент, что исследуемый результат скорее всего генерируется случайным процессом. И у того процесса есть шум. И хотелось бы знать параметры этого шума, чтобы понять действительно есть разница или это просто случайность.
Если перефразировать мой вопрос, то он звучит так: "Если все пользователи сайта за период считаются выборкой, то что тогда является генеральной совокупностью?".
источник

A

Andrey in R (язык программирования)
Григорий Демин
Тут есть момент, что исследуемый результат скорее всего генерируется случайным процессом. И у того процесса есть шум. И хотелось бы знать параметры этого шума, чтобы понять действительно есть разница или это просто случайность.
разница действительно есть независимо от механизма порождения данных. Вопрос в причинах этих различий.
источник

ГД

Григорий Демин... in R (язык программирования)
Оценить этот шум вы можете разбив а и б на более мелкие группы и поглядеть, как варьируется тестируемый показатель в рамках одной А и одной Б
источник

ГД

Григорий Демин... in R (язык программирования)
Если он действительно строго одинаковый, то тестировать смысла нет
источник

EP

Ed P in R (язык программирования)
Alexander Semenov
Если перефразировать мой вопрос, то он звучит так: "Если все пользователи сайта за период считаются выборкой, то что тогда является генеральной совокупностью?".
все пользователи, которые могут зайти на сайт? Видят рекламу, н-р
источник

AS

Alexander Semenov in R (язык программирования)
Ed P
все пользователи, которые могут зайти на сайт? Видят рекламу, н-р
Вот именно поэтому я и считаю данный вопрос скорее философским.
источник

A

Andrey in R (язык программирования)
В случае с сайтом, если есть старый дизайн А и новый дизайн Б, нет смысла половине всех юзеров показывать новый дизайн, который может быть хуже (ниже конверсия и т.д.) старого.
источник

A

Andrey in R (язык программирования)
чтобы так не рисковать, нужен выборочный метод. С другой стороны, если юзеров мало, то и всех за какой-то небольшой период может не хватить, чтобы задетектить различия
источник

AS

Alexander Semenov in R (язык программирования)
К таким сценариям у меня вопросов нет.
источник

ГД

Григорий Демин... in R (язык программирования)
Alexander Semenov
Если перефразировать мой вопрос, то он звучит так: "Если все пользователи сайта за период считаются выборкой, то что тогда является генеральной совокупностью?".
Ну так тут не про обобщение на генеральную совокупность, а про точность измерения скорее. Насколько ваш результат в одной группе изменчив. Представьте, вы термометром меряете температуру за окном. Десять измерений дадут 10 слегка разных значений. На следующий день вы тоже 10 раз померяете. И вам надо понять, изменилась ли температура или она такая же.
источник

ГД

Григорий Демин... in R (язык программирования)
Так и тут - в одной группе 100 пользователей, в другой 100. Вместе составляют генеральную совокупность. Но каждый пользователь ведёт себя по разному.
источник

AS

Alexander Semenov in R (язык программирования)
Григорий Демин
Так и тут - в одной группе 100 пользователей, в другой 100. Вместе составляют генеральную совокупность. Но каждый пользователь ведёт себя по разному.
Не уверен, что понял...
источник