Size: a a a

R (язык программирования)

2021 January 11

AS

Alexander Semenov in R (язык программирования)
Makha Cloud
Я вообще эксель люблю, если небольшие датасеты, там как раз был R компонент встроен
источник

MC

Makha Cloud in R (язык программирования)
Таблю)))
источник

AS

Alexander Semenov in R (язык программирования)
Alexander Semenov
? Он даже с заводскими настройками хорош. Ну и в DALEX особых телодвижений нет. А вот та же Борута как и RF, на котором она построена, не воспринимает пропуски в данных.
Т.е. вы вместо одной проблемы (feature importance) получаете две: missing data imputation + feature importance.
источник

AS

Alexander Semenov in R (язык программирования)
+ DALEX является агностичным по отношению к моделям, т.е. в него можно пихать предсказания хоть с линейных моделей, хоть с деревьев, хоть с нейронок.
источник

ЕТ

Евгений Томилов... in R (язык программирования)
igor
А без борута никак?
Без всего как. Но в данном случае я делаю так в данный момент.
источник

ЕТ

Евгений Томилов... in R (язык программирования)
Alexander Semenov
Т.е. вы вместо одной проблемы (feature importance) получаете две: missing data imputation + feature importance.
А интересно, я посмотрю, спасибо!
источник

R

R in R (язык программирования)
Раз уж пошла жара, то прорекламирую одновременно лучший и худший аккаунт в твиттере
https://twitter.com/ryxcommar/status/1289269077928628226?s=19
источник

i

igor in R (язык программирования)
Евгений Томилов
Без всего как. Но в данном случае я делаю так в данный момент.
А как же окама?
источник

ЕТ

Евгений Томилов... in R (язык программирования)
igor
А как же окама?
Можно ссылочку, если не затруднит?
источник

i

igor in R (язык программирования)
Принцип лезвия окамы не плодить сущности без надобности
источник

ЕТ

Евгений Томилов... in R (язык программирования)
igor
Принцип лезвия окамы не плодить сущности без надобности
А.
источник

ЕТ

Евгений Томилов... in R (язык программирования)
Ну, если есть проще метод, то я радостью о нём узнаю. При этом не ниже по эффективности.
источник

Н

Не Миша in R (язык программирования)
igor
Принцип лезвия окамы не плодить сущности без надобности
Он всё-таки Оккам. Так что, бритва Оккама
источник

AS

Alexander Semenov in R (язык программирования)
Можно ещё обсудить, что популярная формулировка принадлежит не ему, т.к. сам он использовал несколько иные слова.
источник

HC

Herman Cherniaiev in R (язык программирования)
Ребята, подскажите как работать с большим корусом документов, после обработки текста и стэмминга в словаре получается 45к слов, tf-idf матрица на столько столбцов слишком большая, ни одну модель не могу обучить
источник

ГД

Григорий Демин... in R (язык программирования)
45 тыс слов - это не очень много. Если матрица в разряженном формате, то glmnet нормально работает.
источник

ГД

Григорий Демин... in R (язык программирования)
Модели из пакета text2vec тоже без проблем
источник

ГД

Григорий Демин... in R (язык программирования)
Или сколько документов у вас?
источник

IY

Igor Yakubovskiy in R (язык программирования)
Коллеги, как эффективно создать несколько новых столбцов на основании уже существующих
Например, есть три столбца с продажами в рублях, три столбца с продажами в штуках и нужно создать три столбца с ценой
И все на основании паттернов (типа паттерны для названия компаний например) ?
В data.table
источник

HC

Herman Cherniaiev in R (язык программирования)
Документов около 200к и 2405 классов
источник