Естественно. Скажем так, меня заинтересовала теоретическая сторона вопроса. ОК, сегодня у меня выборки по 200 человек из 8300, это несущественно, отошлю их к обычному хи-квадрату онлайн. Или покажу три кнопки в SPSS. Если завтра будет 200 человек из 500, я понимаю, что метод будет не совсем правильным, он рассчитан на бесконечно большую генсовокупность. Какую формулу давать тогда
мне кажется, для простых случаев это должно как-то аналитически выводиться. Есть же формула расчёта доверительного интервала для генеральной доли с учётом размеров выборки и генсовокупности. Почему бы не быть формуле для разницы
коллеги, я что-то задумался. Методы кросстабуляции рассчитаны на выборку из бесконечно большой генеральной совокупности. Есть ли методы расчёта, учитывающие размер генеральной совокупности, когда она не очень велика, и опрошенная выборка составляет относительно существенную её часть?
Разве это не проблема репрезентативности выборки, которая не имеет прямого отношения к применяемым критериям?
Нет. Это проблема того, что вероятность принятия/отвержения нулевой гипотезы будет изменяться по мере того, как размер выборки становится сопоставим с размером генеральной совокупности
если я достал из одного мешка 5 красных шариков из 10 и из другого мешка 6 красных шариков из 10, то это незначимо для вывода, когда в каждом мешке по 10000 шариков лежит
Нет. Это проблема того, что вероятность принятия/отвержения нулевой гипотезы будет изменяться по мере того, как размер выборки становится сопоставим с размером генеральной совокупности
Это решается поправкой на конечность совокупности. Григорий Демин формулу поправочного коэффициента для стандартной ошибки привел.
коллеги, я что-то задумался. Методы кросстабуляции рассчитаны на выборку из бесконечно большой генеральной совокупности. Есть ли методы расчёта, учитывающие размер генеральной совокупности, когда она не очень велика, и опрошенная выборка составляет относительно существенную её часть?
в R есть пакет survey в нем функция svychisq возможно решит вашу задачу. В spss есть модуль complex samples, тоже для построения планов выборок и их анализа предназначен.