Телеграмм чат группы rlang_ru страница 2249

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

R (язык программирования)

1163 membersпожаловаться на группу

2020 July 28

А

Александр in R (язык программирования)

без цикла можно обойтись почти всегда

источник

14:28пожаловаться #1

E

EK479 in R (язык программирования)

А я правильно понимаю, что boruta отбирает важные переменные. Их по ним можно построить линейную регрессию. Но как быть, например, с взаимодействиями факторов?
Например, наличие камина не значимо в определении цены, а наличие камина и бассейна вместе имеют влияние на цену. Как boruta работает в таком случае?

источник

14:28пожаловаться #2

e

este in R (язык программирования)

А я правильно понимаю, что boruta отбирает важные переменные. Их по ним можно построить линейную регрессию. Но как быть, например, с взаимодействиями факторов?
Например, наличие камина не значимо в определении цены, а наличие камина и бассейна вместе имеют влияние на цену. Как boruta работает в таком случае?

Борута плохо выбирает признаки для линейной регрессии

источник

14:33пожаловаться #3

e

este in R (язык программирования)

А я правильно понимаю, что boruta отбирает важные переменные. Их по ним можно построить линейную регрессию. Но как быть, например, с взаимодействиями факторов?
Например, наличие камина не значимо в определении цены, а наличие камина и бассейна вместе имеют влияние на цену. Как boruta работает в таком случае?

Сначала лучше настроить самому все интересные взаимодействия, а борута их уже отберёт

источник

14:33пожаловаться #4

E

EK479 in R (язык программирования)

este

Борута плохо выбирает признаки для линейной регрессии

А для логистической хорошо работает?

источник

14:35пожаловаться #5

e

este in R (язык программирования)

А для логистической хорошо работает?

Тоже плохо. Старая добрая l1-регуляризация работает лучше

источник

14:36пожаловаться #6

e

este in R (язык программирования)

Если есть желание экзотики для, линейных моделей, попробуйте Boostaroota

источник

14:36пожаловаться #7

e

este in R (язык программирования)

Тот же принцип, только строит xgboost

источник

14:37пожаловаться #8

А

Александр in R (язык программирования)

Борута считает важность фичей почти по-честному (немного не дотягивает до честного shaply value) , строя случайный лес, оэтому когда фичей много (больше сотни), она может не успеть все просчитать, тогда конечно линейка с l1 будет лучше. Но если нет надежды что данные линейные, то быстрота лассо регрессии будет вам без толку. Я бы все равно использовал боруту, просто последовательно выкидывая самые не важные фичи и запуская ее по новой на увеличивающимся наборе данных

источник

14:42пожаловаться #9

А

Александр in R (язык программирования)

ну или можно первый раз пройтись lgbm, только там нужно выбрать total cover в качестве важности, он ближе всех к shaply

источник

14:44пожаловаться #10

AS

Alexander Semenov in R (язык программирования)

Попадалась статья про то, что и shapley отнюдь не идеален как механизм отбора фичей.

источник

15:16пожаловаться #11

А

Александр in R (язык программирования)

ну он медленный, ему нужно перебрать 2^n от числа фичей комбинаций, а про качество мне сложно представить его косяки, наверно есть какие-то, хз

источник

15:20пожаловаться #12

М

Михаил in R (язык программирования)

Александр

используй shift

правильно понимаю, что условием будет тождественность переменной с лагом вперед и с лагом назад? Там где true - делаем замену

источник

15:46пожаловаться #13

А

Александр in R (язык программирования)

правильно понимаю, что условием будет тождественность переменной с лагом вперед и с лагом назад? Там где true - делаем замену

да

источник

15:46пожаловаться #14

М

Михаил in R (язык программирования)

спасибо за наводку

источник

15:50пожаловаться #15

AS

Alexander Semenov in R (язык программирования)

Александр

ну он медленный, ему нужно перебрать 2^n от числа фичей комбинаций, а про качество мне сложно представить его косяки, наверно есть какие-то, хз

https://www.reddit.com/r/MachineLearning/comments/fada8t/r_problems_with_shapleyvaluebased_explanations_as/

[R] Problems with Shapley-value-based explanations as feature...

Posted in r/MachineLearning by u/selib • 29 points and 15 comments

источник

16:21пожаловаться #16

AS

Alexander Semenov in R (язык программирования)

Никто не в курсе, куда делить видеолекции и лабы в R отсюда? https://www.openintro.org/book/stat/

Help Me Decide

OpenIntro's mission is to make educational products that are free, transparent, and lower barriers to education. We're a registered 501(c)(3) nonprofit.

источник

16:40пожаловаться #17

AS

Alexander Semenov in R (язык программирования)

У Рундель-Четинской (или как её там) вроде на Datacamp курс был по мотивам, может поэтому убрали?

источник

16:41пожаловаться #18

AB

Alexey Burnakov in R (язык программирования)

Уже спрашивала про отбор переменных для линейной регрессии и мне подсказали Boruta. Например, в данной статье речь также идет о Random Forest Method, Relative Importance и других методах http://r-statistics.co/Variable-Selection-and-Importance-With-R.html
Скажите, пожалуйста, чем они отличаются и что лучше использовать?

r-statistics.co

Feature Selection With R | Boruta

R Language Tutorials for Advanced Statistics

https://m.habr.com/ru/company/aligntechnology/blog/303750/ это моя статья, я там несколько видов выбора фичей рассмотрел

Методические заметки об отборе информативных признаков (feature selection)

Всем привет!

Меня зовут Алексей Бурнаков. Я Data Scientist в компании Align Technology. В этом материале я расскажу вам о подходах к feature selection, которые мы практикуем в ходе...

источник

17:43пожаловаться #19

AB

Alexey Burnakov in R (язык программирования)

Может, поможет

источник

17:43пожаловаться #20