Size: a a a

R (язык программирования)

2021 May 09

ЕТ

Евгений Томилов... in R (язык программирования)
+
источник

IS

Ilya Shutov in R (язык программирования)
nest порядок не меняет
источник

DK

Dm Kb in R (язык программирования)
в dplyr есть еще nest_by() аналог purrr... менее гибкий, но более лаконичный
источник

IS

Ilya Shutov in R (язык программирования)
тупо через row_number()
источник

ДВ

Дмитрий Володин... in R (язык программирования)
Ну возможно заказчик как раз на выходе хочет другой порядок, я к этому. ТЗ не чёткое))
источник

IS

Ilya Shutov in R (язык программирования)
1. nest
2. сортировка по нужному правилу
3. id = row_number()

либо
1. left_join со справочником сортировки (group_name, id) после unnest

Полный ручной контроль
источник
2021 May 10

AK

Alena Konina in R (язык программирования)
Добрый вечер! Скажите, пожалуйста, можно ли во множественной логистической регрессии оценить важность предикторов? Я смогла пока найти только, как это сделать через dominance analysis, но он использует R2. Насколько я понимаю, по R2 в логистической регрессии так и не смогли определиться, так что он разный по разным подсчетам. Или вообще некорректно говорить о том, какой предиктор делает больший вклад в дисперсию в случае таких моделей? Заранее спасибо!
источник

ЕТ

Евгений Томилов... in R (язык программирования)
Вы можете построить 95% доверительные интервалы для отношений шансов и оценить их. Грубо говоря, если ДИ не пересекает 0, то предиктор значимо связан с изменением шансов наступления события.
источник

ЕТ

Евгений Томилов... in R (язык программирования)
А "величину эффекта" можно оценить как раз по отношению шансов, то есть, экспоненте от коэффициента.
источник

AK

Alena Konina in R (язык программирования)
поняла, спасибо!
источник

h

helby in R (язык программирования)
Ребята, а вы Селениумом в Р пользовались?

Я вот при первой попытке обнаружил ошибку при подключении к Хрому

Прочитал что нужно докер установить

Но вот у меня в командной строке его не находит

Возможно есть способы легче как нибудь настроить работу Селениума?
источник

h

helby in R (язык программирования)
источник

h

helby in R (язык программирования)
На том самом языке настраивал с помощью скачивания ChromeDriver

тут так не прокатит?
источник

AA

A.K. A.K. in R (язык программирования)
А разве через summary нельзя посмотреть важность предикторов? Вроде через summary и показывается необходимая информация
источник

AK

Alena Konina in R (язык программирования)
посмотреть можно, но в логистической регрессии не такая прямолинейная интерпретация коэффициентов, как в простых линейных
источник

AA

A.K. A.K. in R (язык программирования)
Ну можно как раз построить со большим количеством, потом через summary отобрать предикторы и построить новую модель. Сравнить через матрицу неточностей результаты по первой модели и по второй. По крайней мере определённые авторы именно так и советуют делать в применах с лог регрессией.
источник

A

Andrey in R (язык программирования)
оценка важности предикторов - целая наука.
См.
https://ema.drwhy.ai/
https://christophm.github.io/interpretable-ml-book/preface-by-the-author.html
источник

A

Andrey in R (язык программирования)
для линейных моделей при кажущейся простоте все тоже не так просто. Проблемы с интерпретацией весов как важности фич возникают не только при большом количестве предикторов, но и при наличии коррелирующих предикторов, при включении в модель взаимодействий, да и просто при добавлении регуляризации
источник

IS

Ilya Shutov in R (язык программирования)
1. А почему именно селениум? rvest не годится?
2. Если не годится, то можно легче.

=== По шагам ===
1. Качаем Selenium. Берем selenium-server-standalone-x.x.x с сайта [Selenium Downloads](https://www.selenium.dev/downloads/)
2. Качаем RSelenium: devtools::install_github("ropensci/RSelenium")
3. Качаем WebDriver под установленные версии браузеров, кладем в PATH (проще и лучше рядом с сервером, поскольку драйвера зависят от версий браузеров).
 - [ChromeDriver - WebDriver for Chrome](https://sites.google.com/a/chromium.org/chromedriver/downloads)
 - [Mozilla GeckoDriver](https://github.com/mozilla/geckodriver/releases)
4. Запускаем Selenuim Server из cmd командой java -jar selenium-server-standalone-3.141.59.jar
5. Запускаем remDr <- remoteDriver(browserName = "chrome"), описание здесь: [RSelenium: Driving OS/Browsers local and remote](https://cran.r-project.org/web/packages/RSelenium/vignettes/RSelenium-saucelabs.html). Если оказалась неправильная версия драйвера, убиваем процессы драйверов.

Проверяем
library(RSelenium)

remDrv <- remoteDriver(browserName = "chrome")
remDrv$open()
remDrv$navigate("https://habr.com/ru/post/548636/")
src <- remDrv$getPageSource()
remDrv$quit()
источник

AK

Alena Konina in R (язык программирования)
спасибо
источник