Size: a a a

R (язык программирования)

2020 July 28

E

EK479 in R (язык программирования)
Спасибо!
источник

AB

Alexey Burnakov in R (язык программирования)
Я в последнее время делаю отбор с помощью l1 glmnet с кроссвалидацией (с предварительным масштабированием фичей) и сразу делаю попарные взаимодействия через data.matrix
источник

AB

Alexey Burnakov in R (язык программирования)
Хотя это тоже однобоко
источник

AB

Alexey Burnakov in R (язык программирования)
Alexey Burnakov
Я в последнее время делаю отбор с помощью l1 glmnet с кроссвалидацией (с предварительным масштабированием фичей) и сразу делаю попарные взаимодействия через data.matrix
Можно попробовать так (не уверен, что это прямо научно). 1) Получаете после предложенных шагов ненулевые фичи. 2) сортируете их по убыванию абсолютного значения коэффициента (помним, что к данным применялся scale). 3) в цикле по фичам строите по две лин.модели с k и k+1 фичами. И считаете p-value в рамках ANOVA (для F-statistic) для двух моделей. Цикл идёт до достижения K (все фичи включены). 4) выбираете те фичи, где p-value впервые превысилр критикал (0.05/K, например)
источник

AB

Alexey Burnakov in R (язык программирования)
Тут нюанс в том, что предварительная сортировка улучшает шанс того, что модель будет наполняться более релевантными фичами и реже будет такое, что на дцатой Анове встретится очень важная фича
источник

AB

Alexey Burnakov in R (язык программирования)
Но доказательности этой методологии я не выводил
источник

PU

Philipp Upravitelev in R (язык программирования)
коллеги, а никто не видел какие-нибудь онлайн-песочницы, где можно поиграться с разными версиями R?
источник

АК

Артём Клевцов... in R (язык программирования)
Philipp Upravitelev
коллеги, а никто не видел какие-нибудь онлайн-песочницы, где можно поиграться с разными версиями R?
Жупитер ноутбук.
источник

PU

Philipp Upravitelev in R (язык программирования)
разные ядра ставить? вот же мерзость
мне бы онлайн лучше...
источник

АК

Артём Клевцов... in R (язык программирования)
Philipp Upravitelev
разные ядра ставить? вот же мерзость
мне бы онлайн лучше...
RSudio Connect.
источник

A

Andrey in R (язык программирования)
в обычной Студии тоже можно версии менять (на винде)
источник

A

Andrey in R (язык программирования)
источник

PU

Philipp Upravitelev in R (язык программирования)
я хотел 2.14 потыкать %))))

ладно, спасибо, посмотрю коннект
источник

ДВ

Дмитрий Володин... in R (язык программирования)
Коллеги, привет. Мои приключения со связкой R+MSSQL продолжаются. С помощью RODBC прочитал таблицу без проблем, которую не мог прочитать через DBI. А вот записать в неё не могу. Ни sqlSave, ни sqlUpdate. Ошибки разные. Если записывать as is, без изменения типов данных под колонки таблицы в БД, - вообще из сессии выкидывает, если типы привести в соответствие, - то пишет cannot update without unique column (просит PK?). Пришлось писать дикий костыль на формирование INSERT SQL запроса. Stackoverflow советует так; другие советы оттуда не дали результата. Есть ли вариант без вот этого костыля с формированием запроса в скрипте и отправки этой строки в БД? ПС. До этого таблица обновлялась в питоне тупо через pandas.to_sql с указанием dtype. Сейчас захотелось всё перевести в R, а именно попробовать загрузку через plumber.
источник

S

Stan in R (язык программирования)
А питон корректно обрабатывает записи? Не могут быть косяки в кодировках?
источник

А

Александр in R (язык программирования)
интересная работа, хотя полностью ее я так и не прочитал, только кусками. Ну ребята там говорят что никто толком не понимает (среди опрошенных участников) что делает Шепли, но все ему доверяют. С другой стороны толковой альтернативы все равно нет.
источник

ДВ

Дмитрий Володин... in R (язык программирования)
Stan
А питон корректно обрабатывает записи? Не могут быть косяки в кодировках?
Да, с ним всё ок. В своё время намучился (потому что питон совсем не моё и не идёт обучение никак, всё время в Р обратно скатываюсь), но сейчас всё записывается верно, сверки несколько раз в месяц провожу с другим "официальным" источником)
источник

ГД

Григорий Демин... in R (язык программирования)
Александр
интересная работа, хотя полностью ее я так и не прочитал, только кусками. Ну ребята там говорят что никто толком не понимает (среди опрошенных участников) что делает Шепли, но все ему доверяют. С другой стороны толковой альтернативы все равно нет.
А чего там непонятного?  Это из теории игр - как изменится результат, если удалить один из признаков.
источник

А

Александр in R (язык программирования)
Григорий Демин
А чего там непонятного?  Это из теории игр - как изменится результат, если удалить один из признаков.
Формула понятна, в статье пишут что опрашивали ряд людей из бизнеса и дс
источник

A

Andrey in R (язык программирования)
SHAP же реально считают по выборке из всех возможных вариантов, получая приближенное значение. Там все не так уж критично медленно получается
источник