Size: a a a

R language and Statistical data analysis

2020 May 20

EL

Edgar Lakshin in R language and Statistical data analysis
Всем, привет!
Столкнулся с тем, что по расписанию не запусается скрипт на основе  пакета RGA. |
Настраиваю через   Add On Taskscheduler. В Таск менеджере статус, скрипт отработан. Куда необходимо копать, чтобы узнать что делает  скрипт в режиме автозапуска, если результатов его не видно
источник

PD

Pavel Demin in R language and Statistical data analysis
Edgar Lakshin
Всем, привет!
Столкнулся с тем, что по расписанию не запусается скрипт на основе  пакета RGA. |
Настраиваю через   Add On Taskscheduler. В Таск менеджере статус, скрипт отработан. Куда необходимо копать, чтобы узнать что делает  скрипт в режиме автозапуска, если результатов его не видно
настройте запуск через встроенный планировщик заданий.
сам скрипт запускайте через R CMD BATCH и смотрите потом файл *.Rout - в него записываются логи выполнения R скрипта. Вероятно там будет указана ошибка
источник

EL

Edgar Lakshin in R language and Statistical data analysis
спасибо. попробую
источник

АР

Александр Райков... in R language and Statistical data analysis
Philipp Upravitelev
частная эта и частная омега вроде как для дисперсионного используются
ЕМНИП, частный эта-квадрат для количественного предиктора - это получастная (part) корреляция. Все норм
источник

АР

Александр Райков... in R language and Statistical data analysis
Philipp Upravitelev
частная как раз для взаимодействия факторов, насколько я помню
общая - для независимых
но да, лакенс в этом лучше объяснит
Почему? Частный эта-квадрат частный потому, что отвечает на вопрос, какая часть дисперсии отклика объясняется конкретно данной независимой переменной. Причём здесь взаимодействие?
источник

АР

Александр Райков... in R language and Statistical data analysis
greengrocery
Здравствуйте! Посоветуйте, пожалуйста, как допилить анализ под требования рецензента. Анализируются результаты эксперимента, данные состоят из количественного ответа и нескольких качественных и количественных предикторов. Рецензент просил использовать GLM вместо изначального ANOVA (хотя данные требуют простой линейной модели) и самое страшное - привести standardized effect sizes.

А этих показателей очень много, второй день не могу разобраться в теме. Для линейных моделей советуют использовать eta^2. Нашел две функции, которые считают этот показатель: effectsize::eta_squared() и heplots::etasq() - но они не хотят работать с glm-объектами.

Наша модель выглядит как glm(A ~ B + C + B:C).
Приемлемо ли будет считать eta squared в нашем случае, или есть лучшие методы?
И можно ли их рассчитать для lm() с той же формулой? Т.е.:

lm_model <- lm(A ~ B + C + B:C, data = data)
effectsize::eta_squared(lm_model, partial = F, ci = 0.95)
Дисперсионный анализ - это и есть вариант общей линейной модели, когда все предикторы категориальны. Точнее, с помощью общей линейной модели можно его посчитать точно так же, как и классическим подходом
источник

АР

Александр Райков... in R language and Statistical data analysis
В случае сбалансированной выборки не будет никакой разницы между классическим вычислением ANOVA и вычислением с помощью общей линейной модели
источник

АР

Александр Райков... in R language and Statistical data analysis
Если какие-то выборки больше других, то эффекты факторов и/или взаимодействия коррелированы, и частично конкурируют в объяснении отклика. Расчёт по GLM будет делать коррекцию и решать, кому отдать ту часть отклика, которую можно обьяснить сразу несколькими факторами (в частности, наиболее распространённый III тип суммы квадратов оценивает только уникальные неперекрываемые эффекты, а все совместно объясняемые части дисперсии не отдаёт никому). А расчёт многофакторного дисперсионного классическим подходом на эту ситуацию не рассчитан (см. Парадокс Симпсона)
источник

АР

Александр Райков... in R language and Statistical data analysis
Насчёт R не знаю, но в SPSS при заказе многофакторного дисперсионного анализа просто по умолчанию используется общая линейная модель, там даже нельзя сделать классику. Потому что при сбалансированных выборках получается абсолютно все то же самое, а при несбалансированных - GLM не ломается в отличие от классики
источник

g

greengrocery in R language and Statistical data analysis
Александр Райков
Почему? Частный эта-квадрат частный потому, что отвечает на вопрос, какая часть дисперсии отклика объясняется конкретно данной независимой переменной. Причём здесь взаимодействие?
Да, посмотрел пару статей по этим метрикам.
https://msu.edu/~levinet/eta%20squared%20hcr.pdf
https://www.frontiersin.org/articles/10.3389/fpsyg.2013.00863/full
Про взаимодействие факторов там не было речи. Насколько я понял, для сравнения эффектов в пределах своей работы удобнее eta squared, а partial eta squared лучше для метаанализа.
источник

g

greengrocery in R language and Statistical data analysis
Александр Райков
Насчёт R не знаю, но в SPSS при заказе многофакторного дисперсионного анализа просто по умолчанию используется общая линейная модель, там даже нельзя сделать классику. Потому что при сбалансированных выборках получается абсолютно все то же самое, а при несбалансированных - GLM не ломается в отличие от классики
Дизайн у нас довольно простой и сбалансированный, но GLM использована по прихоти рецензента и оппортунизму первого автора. Результаты вызова aov и glm на этих данных одинаковые.
источник

АР

Александр Райков... in R language and Statistical data analysis
greengrocery
Дизайн у нас довольно простой и сбалансированный, но GLM использована по прихоти рецензента и оппортунизму первого автора. Результаты вызова aov и glm на этих данных одинаковые.
Ну понятно. Назвали воду дигидрогеном монооксидом для умной красивости
источник

АР

Александр Райков... in R language and Statistical data analysis
greengrocery
Да, посмотрел пару статей по этим метрикам.
https://msu.edu/~levinet/eta%20squared%20hcr.pdf
https://www.frontiersin.org/articles/10.3389/fpsyg.2013.00863/full
Про взаимодействие факторов там не было речи. Насколько я понял, для сравнения эффектов в пределах своей работы удобнее eta squared, а partial eta squared лучше для метаанализа.
С точки зрения GLM взаимодействие - это такой же столбец или столбцы данных, загружаемых в множественную регрессию, как и все остальное. Их получают умножением главных эффектов, но дальше никакой разницы
источник

АР

Александр Райков... in R language and Statistical data analysis
greengrocery
Да, посмотрел пару статей по этим метрикам.
https://msu.edu/~levinet/eta%20squared%20hcr.pdf
https://www.frontiersin.org/articles/10.3389/fpsyg.2013.00863/full
Про взаимодействие факторов там не было речи. Насколько я понял, для сравнения эффектов в пределах своей работы удобнее eta squared, а partial eta squared лучше для метаанализа.
Хм, eta squared - это же вроде r-квадрат для всех факторов совокупно, без выделения частных вкладов
источник

АР

Александр Райков... in R language and Statistical data analysis
Ссылки с телефона не открываются
источник

g

greengrocery in R language and Statistical data analysis
Eta squared - это 'the sum of squares of the effect divided by the total sum of squares':
η2 = SSeffect/SStotal

А partial eta squared:
η2p = SSeffect/(SSeffect+SSerror)
источник

g

greengrocery in R language and Statistical data analysis
получается, взаимодействие факторов тут как будто не должно влиять
источник

АР

Александр Райков... in R language and Statistical data analysis
greengrocery
получается, взаимодействие факторов тут как будто не должно влиять
На что?
источник

АР

Александр Райков... in R language and Statistical data analysis
На величину эта-квадрата при сбалансированном дизайне? Ну по такой формуле да
источник

АР

Александр Райков... in R language and Statistical data analysis
Спасибо за просвещение
источник