Size: a a a

R (язык программирования)

2020 August 03

JS

Jury Sergeev in R (язык программирования)
это уже вне R, через bash, если оно доступно
источник

ВН

Вадим Николаенко... in R (язык программирования)
Доброго времени суток.
Коллеги, подскажите, пожалуйста, чем можно заменить  str_replace_all

Или может быть кто-то знает как исправить ошибку при замене латинской буквы на кириллицу

str_replace_all(string, "f", "ф")

Потому как выдает что-то вроде арабских )
источник

ВН

Вадим Николаенко... in R (язык программирования)
Вопрос снимается спасибо
источник

ВН

Вадим Николаенко... in R (язык программирования)
Решил таким образом

str_replace_all(string, "f", enc2utf8 ("ф"))
источник

ВН

Вадим Николаенко... in R (язык программирования)
Хотя раньше работало и так
источник

ГД

Григорий Демин... in R (язык программирования)
Вадим Николаенко
Хотя раньше работало и так
Могу предположить, что сейчас скрипт в виндовой кодировке
источник

RB

Roman Bednarskiy in R (язык программирования)
Вадим Николаенко
Доброго времени суток.
Коллеги, подскажите, пожалуйста, чем можно заменить  str_replace_all

Или может быть кто-то знает как исправить ошибку при замене латинской буквы на кириллицу

str_replace_all(string, "f", "ф")

Потому как выдает что-то вроде арабских )
На всякий случай всегда следует делать преобразование, да.
источник

ВН

Вадим Николаенко... in R (язык программирования)
Григорий Демин
Могу предположить, что сейчас скрипт в виндовой кодировке
Сохранено с кодировкой utf-8 🤷‍♂
источник
2020 August 04

E

EK479 in R (язык программирования)
Подскажите, пожалуйста)
Я строю lasso регрессию. Так как эта функция принимает только числа, то я использую model.matrix. При попытке предсказать результаты возникает такая ошибка: Ошибка в cbind2(1, newx) %*% nbeta :
 Cholmod error 'X and/or Y have wrong dimensions' at file ../MatrixOps/cholmod_sdmult.c, line 90
Правильно ли я понимаю, что это может быть связано с тем, что некоторые мои факторные переменные в тренировочном и тестовом наборе имеют разные levels? Например, в тренировочном наборе переменная Utilities имеет Factor w/ 2 levels "AllPub","NoSeWa", а в тестовом наборе только один Factor w/ 1 levels "AllPub".
источник

IS

Ivan Struzhkov in R (язык программирования)
Попробуйте от факторов вообще избавиться
источник

E

EK479 in R (язык программирования)
Ivan Struzhkov
Попробуйте от факторов вообще избавиться
Вы имеете в виду оставить только переменные типа numeric?
источник

IS

Ivan Struzhkov in R (язык программирования)
А так стоп
источник

IS

Ivan Struzhkov in R (язык программирования)
Проверьте что у вас целевая переменая исключена из тестовой выборки
источник

IS

Ivan Struzhkov in R (язык программирования)
вторая причина возможная - неймнинг колонок совпадать должен
источник

E

EK479 in R (язык программирования)
Ivan Struzhkov
вторая причина возможная - неймнинг колонок совпадать должен
Первая причина уже проверена. Вторую причину я описала в своем вопросе. Видимо, ее и придется сейчас устранять.
источник

IS

Ivan Struzhkov in R (язык программирования)
ну и к нумерик привести тоже стоит проверить
источник

IS

Ivan Struzhkov in R (язык программирования)
еще провертье что newx это дата фрейм а не матрица
источник

E

EK479 in R (язык программирования)
Ivan Struzhkov
еще провертье что newx это дата фрейм а не матрица
почему? https://rstatisticsblog.com/data-science-in-action/machine-learning/lasso-regression/
в данном примере это как раз матрица
источник

ГД

Григорий Демин... in R (язык программирования)
EK479
Подскажите, пожалуйста)
Я строю lasso регрессию. Так как эта функция принимает только числа, то я использую model.matrix. При попытке предсказать результаты возникает такая ошибка: Ошибка в cbind2(1, newx) %*% nbeta :
 Cholmod error 'X and/or Y have wrong dimensions' at file ../MatrixOps/cholmod_sdmult.c, line 90
Правильно ли я понимаю, что это может быть связано с тем, что некоторые мои факторные переменные в тренировочном и тестовом наборе имеют разные levels? Например, в тренировочном наборе переменная Utilities имеет Factor w/ 2 levels "AllPub","NoSeWa", а в тестовом наборе только один Factor w/ 1 levels "AllPub".
Наверное, имеет смысл сначала сделать model.matrix, а потом разбить ее на обучающую и тестовую.
источник

ГД

Григорий Демин... in R (язык программирования)
И ещё есть пакет glmnetUtils https://cran.r-project.org/web/packages/glmnetUtils/index.html
Он добавляет формульный интерфейс в glmnet
источник