Ребят, вопрос, а что если найти сильно коррелирующие переменные с целевой переменной и оставить только их, и потом на них построить модель нейронной сети ? Что тогда будет ? Будут ли какие-то проблемы? И наоборот , предсказания получаться хорошими ?
Технически, корреляция говорит нам, насколько вектора переменных сонаправлены и насколько между ними острый угол. Однако, корреляция ничего не говорит о влиянии, то есть, эти две переменные могут быть сонаправлены почти из-за чего угодно.
Если пробовать искать обладающие наибольшей предиктивной силой по отношению к целевой переменной предикторы, то, я думаю, будет более эффективно использовать коэффициенты частных корреляций, которые убирают из коэффициента примесь возможного влияния других измеренных нами переменных.
А, вообще, лучше использовать тогда BORUTA алгоритм, он позволяет достаточно эффективно находить сильные переменные.