Size: a a a

R (язык программирования)

2020 July 29

ДВ

Дмитрий Володин... in R (язык программирования)
Anton Pysanka
сегодня наталкивался на открытый вопрос на гитхабе DBI по поводу проблем с запросом к БД, где запрашивается длинное текстовое поле – когда эта колонка была не в конце запроса, людям выдавало ошибку, как вы написали. но это касалось запрашивания, а не записи
Не оно? https://github.com/r-dbi/odbc/issues/86

Тоже читал, для чтения таблицы этот вариант подходит. Может действительно в БД переставить колонки в этом порядке. Надо попробовать.
источник

AP

Anton Pysanka in R (язык программирования)
источник

ДВ

Дмитрий Володин... in R (язык программирования)
примерно тоже самое)
источник

E

EK479 in R (язык программирования)
Как мне уже здесь сказали, для выбора переменных для регрессионной модели есть разные способы: boruta, xgboost, Boostaroota и другие.
В R есть функция step для выбора значимых предикторов для модели.
1) Объясните, пожалуйста, разницу в работе этих способов. (step, boruta, xgboost, Boostaroota)
2) xgboost может отсортировать значимые переменные только, если они количественные?
3) если кто-то может помочь разобраться с этой темой более детально и ответить на вопросы,  связанные с последовательностью действий, напишите мне, пожалуйста в лс))
источник

AB

Alexey Burnakov in R (язык программирования)
EK479
Как мне уже здесь сказали, для выбора переменных для регрессионной модели есть разные способы: boruta, xgboost, Boostaroota и другие.
В R есть функция step для выбора значимых предикторов для модели.
1) Объясните, пожалуйста, разницу в работе этих способов. (step, boruta, xgboost, Boostaroota)
2) xgboost может отсортировать значимые переменные только, если они количественные?
3) если кто-то может помочь разобраться с этой темой более детально и ответить на вопросы,  связанные с последовательностью действий, напишите мне, пожалуйста в лс))
step не рекомендуется ведущими статистиками, плохо работает
источник

А

Александр in R (язык программирования)
мне кажется 1 и 2 вопросы прекрассно гуглятся
источник

E

EK479 in R (язык программирования)
Alexey Burnakov
step не рекомендуется ведущими статистиками, плохо работает
прочла Вашу статью на habr. backward.search/forward.search и step это разные функции?
просто в step есть direction = c("both", "backward", "forward") , поэтому думала, что принцип действия одинаков
источник

AB

Alexey Burnakov in R (язык программирования)
EK479
прочла Вашу статью на habr. backward.search/forward.search и step это разные функции?
просто в step есть direction = c("both", "backward", "forward") , поэтому думала, что принцип действия одинаков
Оба приема плохие для лин.регрессии. они совершают greedy search
источник

AB

Alexey Burnakov in R (язык программирования)
Я сам часто гуглил это и все время на cross validated одни и те же советы, избегать step
источник

E

EK479 in R (язык программирования)
Alexey Burnakov
Оба приема плохие для лин.регрессии. они совершают greedy search
В Вашей статье  рабочие функции на синтетичесих данных - это gbm, стохастический поиск с линейной функцией оценки важности и оценка важности предикторов, используя стохастический (нежадный) поиск с оценкой важности при помощи взаимной информации. Какие из этих методов по Вашему мнению наиболее эффективны на практике?
источник

AB

Alexey Burnakov in R (язык программирования)
EK479
В Вашей статье  рабочие функции на синтетичесих данных - это gbm, стохастический поиск с линейной функцией оценки важности и оценка важности предикторов, используя стохастический (нежадный) поиск с оценкой важности при помощи взаимной информации. Какие из этих методов по Вашему мнению наиболее эффективны на практике?
Gbm, RF, регуляризация L1 lasso. Все работает, но смотря для чего...
источник

AB

Alexey Burnakov in R (язык программирования)
Если делает линейную модель используйте линейные модели для отбора, и наоборот. Но не смешивать
источник

AB

Alexey Burnakov in R (язык программирования)
EK479
В Вашей статье  рабочие функции на синтетичесих данных - это gbm, стохастический поиск с линейной функцией оценки важности и оценка важности предикторов, используя стохастический (нежадный) поиск с оценкой важности при помощи взаимной информации. Какие из этих методов по Вашему мнению наиболее эффективны на практике?
Почитайте cross validated. Если не изменяет память, главный мат. косяк step в том, что AIC / BIC не сравнимы при разном количестве ковариатов, а это и делается в степе.
источник

E

EK479 in R (язык программирования)
Alexey Burnakov
Почитайте cross validated. Если не изменяет память, главный мат. косяк step в том, что AIC / BIC не сравнимы при разном количестве ковариатов, а это и делается в степе.
Спасибо
источник

AB

Alexey Burnakov in R (язык программирования)
И ещё,  кажется, AIC... Перестает быть валиднвс если модель фитится не явно через максимизации правдоподобия, а это как раз случай OLS
источник

AB

Alexey Burnakov in R (язык программирования)
EK479
Спасибо
источник
2020 July 30

AM

Aleksei Morozov in R (язык программирования)
Подскажите, пожалуйста, использует ли кто в своей деятельности google apps script применительно к гуглтаблицам? Там работа с табличными данными на голом js, уже кушать не могу, как это противно по сравнению с R. Может быть кто-то нашёл решение, как там можно векторизацию прикрутить? на пайпы я не надеюсь, но вдруг
источник

AS

Alexey Seleznev in R (язык программирования)
Aleksei Morozov
Подскажите, пожалуйста, использует ли кто в своей деятельности google apps script применительно к гуглтаблицам? Там работа с табличными данными на голом js, уже кушать не могу, как это противно по сравнению с R. Может быть кто-то нашёл решение, как там можно векторизацию прикрутить? на пайпы я не надеюсь, но вдруг
Думаю вам вот тут лучше спрость,

@google_spreadsheets_chat
источник

AM

Aleksei Morozov in R (язык программирования)
Благодарю!
источник

БА

Байкулов Антон... in R (язык программирования)
Товарищи!

Кто может на пальцах объяснить, как запустить Shiny-приложулю на ShinyServer развернутый на VM Ubuntu 16.04
источник