Проблемы с фейковыми р, насколько я понимаю, растут прежде всего от нарушений случайности набора выборки, во-вторых, от сомнительных исследовательских практик
А это у них в коде? Из описания я понял как: мы делаем регрессию на каждкю переменных по очереди и берем те, что значимы. Далее засовываем значимые в новую модель
Ну, неслучайность выборки вообще что угодно сломает, а для недобросовестных исследователей самая благодать в этом консенсусе бомбить данные тестами до победного