Size: a a a

R (язык программирования)

2021 June 16

АР

Александр Райков... in R (язык программирования)
Я, кстати, на дерьмовых данных получал в линейной регрессии ситуацию, что один из предикторов значим при незначимом F для модели в целом
источник

АР

Александр Райков... in R (язык программирования)
Именно за счёт набитости модели переменными
источник

A

Andrey in R (язык программирования)
Надо бы вообще от значимостей уходить в сторону оценки предсказательной способности на новых данных
источник

АР

Александр Райков... in R (язык программирования)
Имхо, спорный тезис
источник

АР

Александр Райков... in R (язык программирования)
Не во всякой науке доступно так много новых данных, чтобы оценка воспроизводимость результатов на них была сколько-то устойчивой
источник

A

Andrey in R (язык программирования)
Этот фреймворк (с р-значениями) хорошо работает в хорошо спланированных и контролируемых экспериментах, когда план анализа написан до сбора данных
источник

A

Andrey in R (язык программирования)
Иначе неизбежен р-value-hunting
источник

АР

Александр Райков... in R (язык программирования)
Я бы сказал, надо переходить от значимостей отдельных гипотез к проверке целостных комплексных моделей
источник

A

Andrey in R (язык программирования)
Тогда и оценки коэффициентов такие же!
источник

АР

Александр Райков... in R (язык программирования)
Оценки коэффициентов в теории считаются с учётом погрешности, вызванной размером выборки
источник

АР

Александр Райков... in R (язык программирования)
А у кросс-проверки нет стандартной ошибки
источник

A

Andrey in R (язык программирования)
С учетом погрешности считаются доверительные интервалы, а точечная оценка - она точечная и есть
источник

АР

Александр Райков... in R (язык программирования)
Проблемы с фейковыми р, насколько я понимаю, растут прежде всего от нарушений случайности набора выборки, во-вторых, от сомнительных исследовательских практик
источник

DP

Dmitry Penzar in R (язык программирования)
А это у них в коде? Из описания я понял как: мы делаем регрессию на каждкю переменных по очереди и берем те, что значимы. Далее засовываем значимые в новую модель
источник

DP

Dmitry Penzar in R (язык программирования)
Тип результат по качеству тот же, но становится понятнее, куда значимости уплывают.
источник

A

Andrey in R (язык программирования)
Ну, неслучайность выборки вообще что угодно сломает, а для недобросовестных исследователей самая благодать в этом консенсусе бомбить данные тестами до победного
источник

АР

Александр Райков... in R (язык программирования)
Р-значение и доверительный - это два ракурса на одно и то же
источник

АР

Александр Райков... in R (язык программирования)
Р - это 1- максимальная  доверительная вероятность того, что интервал не захватит 0
источник

АР

Александр Райков... in R (язык программирования)
Мне казалось, что наоборот. Видимо, неправильно прочёл. Но описанное вами - столь же, если не менее осмысленная процедура
источник

АР

Александр Райков... in R (язык программирования)
На то и множественная регрессия, чтобы давать значимость предикторам, неспособным показать значимость порознь
источник