Size: a a a

R (язык программирования)

2020 September 03

A

Andrey in R (язык программирования)
3% различий незначимы на такой выборке
источник

АР

Александр Райков... in R (язык программирования)
и задумался, а если меня спросят, куда здесь генеральную совокупность вводить, то что я им скажу
источник

АР

Александр Райков... in R (язык программирования)
Естественно. Скажем так, меня заинтересовала теоретическая сторона вопроса. ОК, сегодня у меня выборки по 200 человек из 8300, это несущественно, отошлю их к обычному хи-квадрату онлайн. Или покажу три кнопки в SPSS. Если завтра будет 200 человек из 500, я понимаю, что метод будет не совсем правильным, он рассчитан на бесконечно большую генсовокупность. Какую формулу давать тогда
источник

PU

Philipp Upravitelev in R (язык программирования)
насколько я помню, есть правило, что если выборка составляет более 10% генсовокупности, то тесты могут сбоить и вообще не очень применимы
источник

АР

Александр Райков... in R (язык программирования)
Philipp Upravitelev
насколько я помню, есть правило, что если выборка составляет более 10% генсовокупности, то тесты могут сбоить и вообще не очень применимы
Вот. А что тогда делать?
источник

PU

Philipp Upravitelev in R (язык программирования)
не знаю :(
страдать? уменьшать выборку и бутстрапить? просто брать описательные?
не знаю.
источник

АР

Александр Райков... in R (язык программирования)
мне кажется, для простых случаев это должно как-то аналитически выводиться. Есть же формула расчёта доверительного интервала для генеральной доли с учётом размеров выборки и генсовокупности. Почему бы не быть формуле для разницы
источник

АР

Александр Райков... in R (язык программирования)
просто не гуглиццо, блин.
источник

АК

Артём Клевцов... in R (язык программирования)
Александр Райков
коллеги, я что-то задумался. Методы кросстабуляции рассчитаны на выборку из бесконечно большой генеральной совокупности. Есть ли методы расчёта, учитывающие размер генеральной совокупности, когда она не очень велика, и опрошенная выборка составляет относительно существенную её часть?
Разве это не проблема репрезентативности выборки, которая не имеет прямого отношения к применяемым критериям?
источник

АР

Александр Райков... in R (язык программирования)
Нет. Это проблема того, что вероятность принятия/отвержения нулевой гипотезы будет изменяться по мере того, как размер выборки становится сопоставим с размером генеральной совокупности
источник

АР

Александр Райков... in R (язык программирования)
если я достал из одного мешка 5 красных шариков из 10 и из другого мешка 6 красных шариков из 10, то это незначимо для вывода, когда в каждом мешке по 10000 шариков лежит
источник

АР

Александр Райков... in R (язык программирования)
а если известно, что в каждом мешке всего 12 шариков, то подозревать, что во втором красных больше, чем в первом, уже достаточно обосновано
источник

АР

Александр Райков... in R (язык программирования)
даже если шарики извлекаются абсолютно случайным образом
источник

YS

Yuriy Saraikin in R (язык программирования)
Александр Райков
Нет. Это проблема того, что вероятность принятия/отвержения нулевой гипотезы будет изменяться по мере того, как размер выборки становится сопоставим с размером генеральной совокупности
Это решается поправкой на конечность совокупности. Григорий Демин формулу поправочного коэффициента для стандартной ошибки привел.
источник

YS

Yuriy Saraikin in R (язык программирования)
Александр Райков
коллеги, я что-то задумался. Методы кросстабуляции рассчитаны на выборку из бесконечно большой генеральной совокупности. Есть ли методы расчёта, учитывающие размер генеральной совокупности, когда она не очень велика, и опрошенная выборка составляет относительно существенную её часть?
в R есть пакет survey в нем функция svychisq возможно решит вашу задачу. В spss есть модуль complex samples, тоже для построения планов выборок и их анализа предназначен.
источник

В

Виктор in R (язык программирования)
Коллеги. подскажите плз есть ли пакеты для работы с 1С
источник

IT

Inip Tyig in R (язык программирования)
погодите, для какой работы конкретно?
источник

IT

Inip Tyig in R (язык программирования)
сомневаюсь что вы найдете коннектор типа клиента
источник

IT

Inip Tyig in R (язык программирования)
есть вариант потормошить сервер БД если там клиент-серверная версия, а если файловая то это уже посильнее нужно заморочиться
источник

В

Виктор in R (язык программирования)
Да, мне уже обосновали за особенности((
источник