Size: a a a

R (язык программирования)

2020 September 12

ГД

Григорий Демин... in R (язык программирования)
Один пользователь, одно измерение. Вы считаете среднее измерение в группе. У среднего уже есть погрешность. Теперь вам надо сравнить две группы и убедиться, что разница не обусловлена погрешностью измерений, а обусловлена разницей между группами.
источник

AS

Alexander Semenov in R (язык программирования)
В такой постановке любое сравнение по группам требует проверки стат. значимости.
источник

ГД

Григорий Демин... in R (язык программирования)
Ага
источник

ГД

Григорий Демин... in R (язык программирования)
Разве что продажи в некоторых ситуациях не требует. Ну  само количество пользователей в группах а и б абсолютно точно известно
источник

AS

Alexander Semenov in R (язык программирования)
Звучит слишком радикально для меня. Я к такому пока не готов.
источник

ГД

Григорий Демин... in R (язык программирования)
Alexander Semenov
Звучит слишком радикально для меня. Я к такому пока не готов.
А чего радикального? Если всех посетителей сайта разбить на две группы случайным образом, то между группами будет разница. Вы же не будете считать, что эта разница что-то значит. То есть, когда тестируется что-то настоящее, разница должна быть больше случайной. Вот тут и появляются все тесты
источник

AS

Alexander Semenov in R (язык программирования)
Ну так это и не "любое сравнение по группам".
источник

ГД

Григорий Демин... in R (язык программирования)
Ну вы с этого кейса и начинали с вопросом, зачем здесь стат тест, когда у нас вся генеральная совокупность
источник

AS

Alexander Semenov in R (язык программирования)
Спасибо. Пока что это был самый убедительный аргумент. Надеюсь, что со временем он не выветрится у меня из головы, как все предыдущие.
источник

ИП

Иван Поздняков... in R (язык программирования)
Alexander Semenov
Я тут взялся за старое (dota_science) и в связи с этим возник мой любимый теоретический вопрос: если я взял все проф. матчи в доту за определённый период (с 01/08/20) и посчитал среднее по какому-либо показателю (винрейт, среднее кол-во убийств), нужно ли мне делать t-test для проверки стат. значимости этих результатов?
Мне кажется, нас обычно интересует даже не та генеральная совокупность, которая объединяет все матчи, а некая идеальная генеральная совокупность, которая объединяет все *возможные* матчи, включая прошедшие и будущие. Иначе бы получалось, что если мы имеем данные о всех прошедших матчах, то нам в принципе не должен быть интересен результат статистических тестов. Но ведь он нам интересен, а значит мы говорим о генеральной совокупности большей чем все прошедшие матчи, о которых у нас есть данные
источник

AS

Alexander Semenov in R (язык программирования)
Если верить в теорию струн и мультивселенную, то так оно, в общем-то и есть.
источник

AS

Alexander Semenov in R (язык программирования)
Но для большинства людей реальность только одна и в ней произошло ровно то, что произошло.
источник

AS

Alexander Semenov in R (язык программирования)
Впрочем, "дилемму" с дотой я для себя решил просто. Т.к. вопрос имеет в том числе и педагогическую подоплёку, то статистику по проф. играм я покажу без стат. тестов, а вот на данных из пабликов сделаю выборку и тогда использование нашей стандартной машинерии станет полностью оправданным.
источник

AS

Alexander Semenov in R (язык программирования)
Пикантность ситуации в моём случае добавляет то, что у героев с "позитивным" sentiment score биографии в среднем больше ассистов, а у героев с "негативным" в среднем больше убийств 😃.
источник

AS

Alexander Semenov in R (язык программирования)
источник

AS

Alexander Semenov in R (язык программирования)
источник

UT

Unknown T. in R (язык программирования)
Добрый день! Я новичок в R, возник простой вопрос. Есть код:
test <- list()
row = iris[1,]
test[1] <- row

Я хочу сохранить один ряд из датасета iris в row, потом добавить его в качестве нового элемента списка в test. Что я делаю не так?
источник

A

Andrey in R (язык программирования)
test[[1]] <- row
источник

UT

Unknown T. in R (язык программирования)
Сурово, а почему так?
источник

A

Andrey in R (язык программирования)
источник