Size: a a a

R (язык программирования)

2021 January 11

ГД

Григорий Демин... in R (язык программирования)
А памяти на машине сколько?
источник

HC

Herman Cherniaiev in R (язык программирования)
50 гб
источник

HC

Herman Cherniaiev in R (язык программирования)
+-*
источник

ГД

Григорий Демин... in R (язык программирования)
Поглядите, какой класс матрицы. class(my_matrix)
источник

HC

Herman Cherniaiev in R (язык программирования)
Как  матрица, но я надеялся как-то пространство признаков уменьшить (словарь сократить)
источник

A

Andrey in R (язык программирования)
Переслано от Andrey
dt <- data.table(var1 = 1:10, var2 = 1:10, var3 = 1:10,
                x1 = 1:10, x2 = 1:10, x3 = 1:10)
for (i in 1:3) {
 new_var <- paste0("new_var", i)
 dt[, (new_var) := get(paste0("var", i)) + get(paste0("x", i))]
}
источник

A

Andrey in R (язык программирования)
Igor Yakubovskiy
Коллеги, как эффективно создать несколько новых столбцов на основании уже существующих
Например, есть три столбца с продажами в рублях, три столбца с продажами в штуках и нужно создать три столбца с ценой
И все на основании паттернов (типа паттерны для названия компаний например) ?
В data.table
Вот вариант
источник

ГД

Григорий Демин... in R (язык программирования)
Herman Cherniaiev
Как  матрица, но я надеялся как-то пространство признаков уменьшить (словарь сократить)
Какая именно матрица? "matrix"?
источник

IY

Igor Yakubovskiy in R (язык программирования)
Andrey
Вот вариант
а точно, спасибо
источник

HC

Herman Cherniaiev in R (язык программирования)
Григорий Демин
Какая именно матрица? "matrix"?
class(.) выдал матрицу, значения числовые, или речь о чем-то другом?
источник

ГД

Григорий Демин... in R (язык программирования)
Матрицы могут быть по разному организованы. Обычно в текстовых данных много нулей. Для матриц с большим количеством нулей ("разряженных" матриц) есть специальные форматы хранения. Они экономят очень много памяти. Но это не класс matrix, а что-нибудь типа dgcmatrix
источник

ГД

Григорий Демин... in R (язык программирования)
А какую модель пытаетесь запустить?
источник

HC

Herman Cherniaiev in R (язык программирования)
Да матрица очень разряженна, есть много слов которые встречаются только в определённых классах, обучать пытался лог регрессию из nnet и деревья из caret или виснет или крашит
источник

AS

Alexander Semenov in R (язык программирования)
Так может эмбеддинги сделать и на них обучить?
источник

HC

Herman Cherniaiev in R (язык программирования)
Типа word2vec?
источник

HC

Herman Cherniaiev in R (язык программирования)
Мне в целом даже супер качество предсказания не нужно
источник

ЕТ

Евгений Томилов... in R (язык программирования)
Хм. А если у меня целевая переменная строго integer, то как мне лучше делать? То есть, обычно регрессия воспринимает integer как float, грубо говоря.
источник

ЕТ

Евгений Томилов... in R (язык программирования)
Просто округлять ответ, что ли... Но это звучит как-то первобытно.
источник

AS

Alexander Semenov in R (язык программирования)
Herman Cherniaiev
Типа word2vec?
Ну да. В text2vec GloVe реализован.
источник

ГД

Григорий Демин... in R (язык программирования)
Herman Cherniaiev
Да матрица очень разряженна, есть много слов которые встречаются только в определённых классах, обучать пытался лог регрессию из nnet и деревья из caret или виснет или крашит
Попробуйте идти по этой статье - http://text2vec.org/vectorization.html
источник