Size: a a a

R (язык программирования)

2020 September 02

AS

Alexey Seleznev in R (язык программирования)
EK479
@AlexeySeleznev @artemklevtsov огромное спасибо за вашу помощь!
получилось в итоге победить?
источник

E

EK479 in R (язык программирования)
Alexey Seleznev
получилось в итоге победить?
да, в итоге я скачала это (https://cran.r-project.org/bin/windows/contrib/4.0/vctrs_0.3.3.zip
источник
2020 September 03

АР

Александр Райков... in R (язык программирования)
коллеги, я что-то задумался. Методы кросстабуляции рассчитаны на выборку из бесконечно большой генеральной совокупности. Есть ли методы расчёта, учитывающие размер генеральной совокупности, когда она не очень велика, и опрошенная выборка составляет относительно существенную её часть?
источник

АР

Александр Райков... in R (язык программирования)
например, опрошено по 200 мужчин и женщин, среди мужчин 97 человек пользуются автобусом, а среди женщин - 105. Но при этом данные иссследования предполагается обобщать только на определённый район (интересует необходимость существования данного машрута автобуса, а не автобусов вообще в мире), а всё население района составляет 17600 человек. По классическому хи-квадрату или Йейтсу разница незначима, но, может, надо как-то учитывать размер генеральной совокупности? Размеры генеральной совокупности мужчин и женщин (видимо, они нужнее общего количества) узнать тоже можно
источник

ГД

Григорий Демин... in R (язык программирования)
Александр Райков
например, опрошено по 200 мужчин и женщин, среди мужчин 97 человек пользуются автобусом, а среди женщин - 105. Но при этом данные иссследования предполагается обобщать только на определённый район (интересует необходимость существования данного машрута автобуса, а не автобусов вообще в мире), а всё население района составляет 17600 человек. По классическому хи-квадрату или Йейтсу разница незначима, но, может, надо как-то учитывать размер генеральной совокупности? Размеры генеральной совокупности мужчин и женщин (видимо, они нужнее общего количества) узнать тоже можно
Есть формула для доверительного интервала с поправкой на размер генеральной совокупности, на на 200 из 17600 разницы не будет
источник

АР

Александр Райков... in R (язык программирования)
а где можно формулу посмотреть?
источник

ГД

Григорий Демин... in R (язык программирования)
https://math.semestr.ru/group/interval-expectation.php там в середине. Что-то типа sqrt(1- n/N)
источник

АР

Александр Райков... in R (язык программирования)
эм. Доверительный интервал для генеральной средней я знаю. И для генеральной доли могу найти
источник

АР

Александр Райков... in R (язык программирования)
тут же доверительный интервал для разницы двух генеральных долей. вот такого не припоминаю
источник

A

Andrey in R (язык программирования)
Александр Райков
тут же доверительный интервал для разницы двух генеральных долей. вот такого не припоминаю
ДИ для разности долей двух генеральных совокупностей равен (0, 0)
источник

A

Andrey in R (язык программирования)
Точнее, +/-0 он равен
источник

YS

Yuriy Saraikin in R (язык программирования)
Александр Райков
эм. Доверительный интервал для генеральной средней я знаю. И для генеральной доли могу найти
Так доля и есть по сути среднее. Можно те же самые Формулы использовать. Формулы можно посмотреть в разделе теория выборки почти в любом учебнике по статистике
источник

АР

Александр Райков... in R (язык программирования)
Andrey
ДИ для разности долей двух генеральных совокупностей равен (0, 0)
Почему?
источник

A

Andrey in R (язык программирования)
Если доступны истинные значения для генеральных совокупностей, статистика не нужна
источник

A

Andrey in R (язык программирования)
Там просто не будет неопределенности, как в определении параметров выборочным методом
источник

АР

Александр Райков... in R (язык программирования)
Yuriy Saraikin
Так доля и есть по сути среднее. Можно те же самые Формулы использовать. Формулы можно посмотреть в разделе теория выборки почти в любом учебнике по статистике
Я понимаю, что доля - это среднее, если наличие категории считать за 1, а отсутствие - за 0. Тут сомнения вызывает не разница "среднее / доля", а переход от задачи одной выборки к задаче сравнения двух
источник

АР

Александр Райков... in R (язык программирования)
Andrey
Если доступны истинные значения для генеральных совокупностей, статистика не нужна
У меня вполне себе задача выборочного исследования. Я не имею данные 17600 человек и не знаю генеральных долей. Я оцениваю разницу между генеральными долями на основе выборок. Просто нюанс в том, что размер выборки показался сравнимым с размером генеральной совокупности
источник

A

Andrey in R (язык программирования)
200 человек не сравнимы с 17600. Это каким-то р-value-huntingом выглядит
источник

АР

Александр Райков... in R (язык программирования)
вообще нет. Я как раз сижу и критикую отчёт, где люди, знающие только про доверительный интервал, пондалелали выводов из разниц в 3%
источник

АР

Александр Райков... in R (язык программирования)
хотел их отослать к расчёту хи-квадрата онлайн, но они из всей статистики знают только доверительный интервал для генеральной доли при известном размере генеральной совокупности
источник