Доброго . Наткнулся на проблему с интерпретацией результатов предсказания.
Предположим, что есть датасет постов в треде. Для каждого поста известны а) >9000 признаков содержания (неуправляемые фичи) б) число репостов в соцсетях, комментариев, пинов и лайков (управляемые фичи) в) число просмотров. Цель: имея ограниченные ресурсы и условную стоимость управляемых фич в ресурсах предложить такую модификацию управляемых фич, чтобы максимизировать предсказание числа просмотров с некоторой затратой ресурсов.
Сложность в том, что сейчас у меня самой лучшей модификацией всегда получается направление 100% ресурсов на фичу, у которой самая большая корреляция с числом просмотров. Это не соответствует реальности и не отражает взаимное влияние фич друг на друга (повышение числа пинов приводит к увеличению всех других фич, например). Можно ли как-то получить более осмысленное распределение?