Size: a a a

R (язык программирования)

2021 February 20

ГД

Григорий Демин... in R (язык программирования)
Анатолий
12 точек (пока с месячным разрезом работаю). На 24 точках получалось не сильно лучше.
Да, на 12 точках действительно может случайно появиться 100 процентная корреляция... Ну тогда PCA - он и работать быстрее должен
источник

A

Ars in R (язык программирования)
Julia Laryushina
Разнесите select и drop в разные запросы.
Скорее всего, Вам возвращается результат последней операции.
Спасибо! Получилось) Правда, разнёс на всякий случай на 3 части: create, select и drop.
источник

ГД

Григорий Демин... in R (язык программирования)
Анатолий
12 точек (пока с месячным разрезом работаю). На 24 точках получалось не сильно лучше.
я поэкспериментировал чуть-чуть - судя по всему, для factanal надо, чтобы количество переменных было меньше или равно, количеству кейсов.
источник

DK

Dm Kb in R (язык программирования)
Григорий Демин
Вот в том то и дело, что на хорошо скореллированных он падать не должен. А только на идеально скоррелерованных. А размер окна какой?
может упасть, там могут получится околонулевые значения, которые R как нули будет воспринимать
источник

ГД

Григорий Демин... in R (язык программирования)
Dm Kb
может упасть, там могут получится околонулевые значения, которые R как нули будет воспринимать
Насколько мне известно, совеременные алгоритмы очень хорошо работают даже в условиях сильной скореллированости
источник

А

Анатолий in R (язык программирования)
Dm Kb
Факторный анализ называется анализом потому как анализировать помогает )) Может быть если вы будите смотреть на него просто как способ снизить размерность по вариации, то вам станет проще с ним работать?
И по поводу корреляции мнение следующее - используйте SVD или PCA на базе SVD т.к. в этих методах производится разложение матрицы по ортогональному базису: если у вас будет сингулярность, то она просто вам обнулит одно из значений вектора собственных чисел... не уверен, что понятно написал(((
Ну и с житейской точки зрения, если у вас 100% корреляции, то это значит, что у вас два входящих предиктора, которые являются одним и тем же, но видимо имеют разную размерность. Ну например длинна детали в мм и в см. Зачем вам такие вещи вообще в модель включать?
Спасибо.  Буду пробовать PCA. Единственное,  что смущает: может так быть,  что факторный анализ находит то,  что pca не видит?

@Gregory_Demin я количество факторов сильно меньше ставлю.  Грубо говоря 100 кейсов -> 3 фактора
источник

ГД

Григорий Демин... in R (язык программирования)
Анатолий
Спасибо.  Буду пробовать PCA. Единственное,  что смущает: может так быть,  что факторный анализ находит то,  что pca не видит?

@Gregory_Demin я количество факторов сильно меньше ставлю.  Грубо говоря 100 кейсов -> 3 фактора
Не факторов, а именно переменных
источник

ГД

Григорий Демин... in R (язык программирования)
Сравните factanal(mtcars[1:11,], 3) и factanal(mtcars[1:12,], 3) А матрица корреляций cor(mtcars[1:11, ]) беды не предвещает
источник

А

Анатолий in R (язык программирования)
Григорий Демин
Не факторов, а именно переменных
Понял! Вообще неожиданно для меня. nrow(x)>ncol(x). Спасибо
источник

DK

Dm Kb in R (язык программирования)
Григорий Демин
Насколько мне известно, совеременные алгоритмы очень хорошо работают даже в условиях сильной скореллированости
смотря какие... и в factanal() речь просто про вычисления обратной матрицы ... во всяком случае, отсылает к LAPACK методу - http://www.netlib.org/lapack/explore-html/d7/d3b/group__double_g_esolve_ga5ee879032a8365897c3ba91e3dc8d512.html#ga5ee879032a8365897c3ba91e3dc8d512
источник

DK

Dm Kb in R (язык программирования)
Анатолий
Спасибо.  Буду пробовать PCA. Единственное,  что смущает: может так быть,  что факторный анализ находит то,  что pca не видит?

@Gregory_Demin я количество факторов сильно меньше ставлю.  Грубо говоря 100 кейсов -> 3 фактора
если в данных что-то есть то SVD(PCA) - это найдет ... в SVD вообще все органично получается: раскладываете матрицу по собственным векторам и сортируете по собственным числам - отсекая мусор ... далее уже можно в линейную регрессию результат засунуть (в другую модель) или проанализировать латентные факторы и попробовать их интерпретировать ... бонусом будет готовые наборы визуализации, которыми можно восхищать окружающих
источник

DK

Dm Kb in R (язык программирования)
Dm Kb
если в данных что-то есть то SVD(PCA) - это найдет ... в SVD вообще все органично получается: раскладываете матрицу по собственным векторам и сортируете по собственным числам - отсекая мусор ... далее уже можно в линейную регрессию результат засунуть (в другую модель) или проанализировать латентные факторы и попробовать их интерпретировать ... бонусом будет готовые наборы визуализации, которыми можно восхищать окружающих
в tidymodels даже таториал был как строить workflows с этапом PCA
источник

БА

Байкулов Антон... in R (язык программирования)
ТоваRищи, а можно ли построить прогнозирование на данных по эффективности онлайн-рекламы?

Это вообще возможно?
источник

EM

Evgeniy Myskov in R (язык программирования)
Байкулов Антон
ТоваRищи, а можно ли построить прогнозирование на данных по эффективности онлайн-рекламы?

Это вообще возможно?
Можно точнее, что хотите сделать?
источник

БА

Байкулов Антон... in R (язык программирования)
Evgeniy Myskov
Можно точнее, что хотите сделать?
Есть данные по контекстной рекламе за последние два года, хочу модель, которая будет прогнозировать результаты на ближайший месяц.
источник

БА

Байкулов Антон... in R (язык программирования)
Интересует именно возможность, можно ли это сделать впринципе и будет ли данная модель достаточно точной, чтобы на её основании принимать решения о например увеличении расходов на рекламу?
источник

Ю

Юрий 🐙💻🤖📊📈🚬... in R (язык программирования)
Байкулов Антон
ТоваRищи, а можно ли построить прогнозирование на данных по эффективности онлайн-рекламы?

Это вообще возможно?
Что понимается под эффективностью? Метрики какие?
источник

БА

Байкулов Антон... in R (язык программирования)
Эффективность контекстной рекламы это достижения определённых действий на сайте (заказы, обращения и т.д.)
источник

М

Марк in R (язык программирования)
Привет) Не подскажете, на что ругается драйвер для MS SQL при установке? jre установил, переменную среду определил, сам rJava встает нормально...
источник

М

Марк in R (язык программирования)
Вот полный скрин
источник