Size: a a a

R (язык программирования)

2021 February 11

JL

Julia Laryushina in R (язык программирования)
Попробуйте натренировать одну модельку без всяких кластеров, уменьшив количество деревьев и зафиксировав глубину.
Посмотрите потребление памяти.
Посчитайте, сколько можете себе позволить.
Наращивайте.
источник

MM

Mikle Mikle in R (язык программирования)
пошел по обратному пути, снизив кол-во кластеров до 5)
источник

JL

Julia Laryushina in R (язык программирования)
кстати, у Вас там доступен ranger в качестве engine, он более экономен по памяти и параллелизуется без дополнительных doParallel
источник

JL

Julia Laryushina in R (язык программирования)
Mikle Mikle
пошел по обратному пути, снизив кол-во кластеров до 5)
Ваше право.
источник

MM

Mikle Mikle in R (язык программирования)
Julia Laryushina
кстати, у Вас там доступен ranger в качестве engine, он более экономен по памяти и параллелизуется без дополнительных doParallel
по опыту ranger дает хуже результаты, но в этом случае можно действительно его попробовать
источник

MM

Mikle Mikle in R (язык программирования)
спасибо за помощь!
источник

JL

Julia Laryushina in R (язык программирования)
источник

iw

iamami whoami in R (язык программирования)
Здравствуйте, помогите пожалуйста. Есть датафрейм с текстом, из него были удалены стоп слова из пакета tm, но остались пустые строки, которые пытался удалить через stripWhitespace, но ничего не происходит. Как можно удалить пустые строки?
источник

iw

iamami whoami in R (язык программирования)
источник

NB

Nikita Bochalgin in R (язык программирования)
источник

iw

iamami whoami in R (язык программирования)
Не получалось через неё
источник

JL

Julia Laryushina in R (язык программирования)
тогда через `!= ""`
источник

пк

пюре красивое... in R (язык программирования)
Если прям пустые строки, можно dplyr::filter(df$word != '') наверное
источник

DK

Dm Kb in R (язык программирования)
Mikle Mikle
по опыту ranger дает хуже результаты, но в этом случае можно действительно его попробовать
источник

DK

Dm Kb in R (язык программирования)
Есть ощущения, что пакет workflows поджирает память на личном опыте ... ну и таки да: чем больше потоков  - тем больше нужно памяти, кроме ranger есть ещё rborist
источник

MM

Mikle Mikle in R (язык программирования)
Спасибо!
источник

JL

Julia Laryushina in R (язык программирования)
Dm Kb
Есть ощущения, что пакет workflows поджирает память на личном опыте ... ну и таки да: чем больше потоков  - тем больше нужно памяти, кроме ranger есть ещё rborist
М юзает tidymodels, там из engines только ranger и randomForest для R
источник

DK

Dm Kb in R (язык программирования)
Julia Laryushina
М юзает tidymodels, там из engines только ranger и randomForest для R
Да, точно, но в рукопашную значит кроссвалидацию делать  (((
источник

MM

Mikle Mikle in R (язык программирования)
А вообще какое у кого впечатление от tidymodels?
источник

A

Andrey in R (язык программирования)
Mikle Mikle
А вообще какое у кого впечатление от tidymodels?
Можно пользоваться, но mlr3 идеологически более правильно сделан
источник