@alext18 как быть, если у меня на 10 запусках кросс-валидации на тестовых данных результат проседает до 0.18-0.5 в трех запусках? В остальном все выглядит очень неплохо: коэффициент детерминации около 0.9, среднеквадратическая ошибка 13, абсолютная ошибка по модулю около 1 при среднем значении предсказываемой штуки около 7-10.
Есть много штук в предсказываемом столбце, которые встречаются по разу, думал их выкинуть из исходных данных. Еще есть мысль возраст нормализовать.