? Он даже с заводскими настройками хорош. Ну и в DALEX особых телодвижений нет. А вот та же Борута как и RF, на котором она построена, не воспринимает пропуски в данных.
Т.е. вы вместо одной проблемы (feature importance) получаете две: missing data imputation + feature importance.
Ребята, подскажите как работать с большим корусом документов, после обработки текста и стэмминга в словаре получается 45к слов, tf-idf матрица на столько столбцов слишком большая, ни одну модель не могу обучить
Коллеги, как эффективно создать несколько новых столбцов на основании уже существующих Например, есть три столбца с продажами в рублях, три столбца с продажами в штуках и нужно создать три столбца с ценой И все на основании паттернов (типа паттерны для названия компаний например) ? В data.table