Size: a a a

R (язык программирования)

2021 April 13

МA

Михаил Ad.fesha... in R (язык программирования)
Ребят, всем привет.
Вопрос, касаемо h20

Задача. Есть х магазинов (более 100). Делаю прогноз (сумма всех продаж) на день (фичи стандарт даты, + несколько функций с ТО связанные). Точность гуд. Но скорость создания модели... печальная. Хотелось бы ускорить все это дело

Варианты которые пришли в голову (не без помощи гугла ессно)
1. У h20 есть параметр - отвечающий за макс затраченное время на создание/проверку модели, но обозначение такого потолка ухудшает общую точность модели.
2. Грузить данные с названием магазина (as.factor) в надежде что h20 это сожрет, пережуют и выплюнет конфетку (вот тут немного сомневаюсь, нид или тест или совет от более опытных коллег)
3. Распараллелить процесс (с этого и начал гуглить, но foreach создает доп сессию R, а h20 - вычисления идут на виртуальной машине джава. Если и есть способ распараллелить, то или лучше гуглить или спросить у более знающий коллег)
4. Вроде как бустинг имеет такой параметр как цпу/гпу (на чем расчеты вести), но на моем серве нет видюхи... расчеты ток на цп могу вести

Есть у кого какие мысли? Может уже кто-то сталкивался с подобной ситуацией?
источник

AS

Alexander Semenov in R (язык программирования)
Так а модель-то в h20 какая в итоге?
источник

МA

Михаил Ad.fesha... in R (язык программирования)
Эм... мб я вопрос неправильно понимаю) там ансамбль моделей лесов и бустинга
источник

МA

Михаил Ad.fesha... in R (язык программирования)
источник

AS

Alexander Semenov in R (язык программирования)
Ну просто у вас не было указано, что используется именно AutoML. Я думал, что там выиграла какая-то конкретная модель и хотел предложить взять другую её реализацию. Например, ligthgbm.
источник

МA

Михаил Ad.fesha... in R (язык программирования)
Да, простите, не указал))
источник

AS

Alexander Semenov in R (язык программирования)
А так, рискну предположить, что ускорять AutoML в h2o можно только параметрами AutoML в h2o.
источник

AB

Alex Bukinich in R (язык программирования)
Добрый день всем!
Кто-нибудь знает хороший пакет для визуализации структурных моделей, получаемых при помощи пакета lavaan? Использую SemPlot, но он выдаёт график в ужасном разрешении. Пробовал варьировать параметры - разрешение такое же ужасное. Другие графики тот же ggplot2 рисует абсолютно нормально.
источник

MM

Mikle Mikle in R (язык программирования)
плюс-минус везде будет хуже, чем если самому нарисовать в PowerPoint
источник

MM

Mikle Mikle in R (язык программирования)
в этом смысле, в stata достаточно неплохо строятся SEM модели, там их можно прямо визуально строить
источник

MM

Mikle Mikle in R (язык программирования)
типа рисовать схему
источник

MM

Mikle Mikle in R (язык программирования)
ну и результаты он сразу на графике также может показывать
источник

MM

Mikle Mikle in R (язык программирования)
вот так это выглядит
источник

AB

Alex Bukinich in R (язык программирования)
Аа, понял! Спасибо большое за ответ и предложение, что мне делать)
источник

KK

Ksenia Kuvshinova in R (язык программирования)
А как генерировать случайный вектор заданной длины и с заданной ковариационной матрицей?
источник

KK

Ksenia Kuvshinova in R (язык программирования)
ааа там пакет MASS надо подключать, верно?
источник

KK

Ksenia Kuvshinova in R (язык программирования)
иначе никак?
источник

A

Andrey in R (язык программирования)
а откуда у вектора ковариационная матрица возьмется?
источник

KK

Ksenia Kuvshinova in R (язык программирования)
ковариационная матрица значений  вектора в смысле
по диагонали дисперсии, вне диагонали ковариации
источник

A

Andrey in R (язык программирования)
значения вектора - это отдельные числа (скаляры), у которых нет ни дисперсии, ни ковариации
источник