Size: a a a

R (язык программирования)

2020 December 13

AS

Alexander Semenov in R (язык программирования)
T.е. никаких неожиданностей и hidden gems.
источник

AS

Alexander Semenov in R (язык программирования)
Что-то мне подсказывает, что аналогичный вопрос про статистику/регрессионный анализ мог бы привести к холивару.
источник

A

Andrey in R (язык программирования)
Alexander Semenov
Ну будем считать, что к консенсусу мы пришли: ISL/ESL, Applied Predictive Modelling, Lantz.
ISL слишком beginner level, ESL вообще не про R, Lantz не читал, но осуждаю
источник

A

Andrey in R (язык программирования)
нужна книга по технической части, инструментарию, поэтому mlr3book или книги про tidy models должны быть в списке
источник

AS

Alexander Semenov in R (язык программирования)
Andrey
ISL слишком beginner level, ESL вообще не про R, Lantz не читал, но осуждаю
Чтоб у всех был такой beginner level
источник

A

Andrey in R (язык программирования)
на питоне все вокруг sklearn построено
источник

AS

Alexander Semenov in R (язык программирования)
Честно говоря, не понимаю, зачем нужен mlr3. Всё равно для "прода" на питоне придется переделать. А поштучно алгоритмы можно из отдельных пакетов поюзать. Всё равно кроме линейных моделей и бустинга ничего не надо особо.
источник

A

Andrey in R (язык программирования)
зачем для прода что-то на питоне переделывать? Там бустец более бустинговый?
источник

A

Andrey in R (язык программирования)
это же все история о том, как обучить модель и не переобучиться, а не как задеплоить. Деплоить-то и на питоне лучше без sklearn, наверное
источник

AS

Alexander Semenov in R (язык программирования)
Потому, что он почти везде на питоне
источник

A

Andrey in R (язык программирования)
ну а переделывать-то ты что будешь? У тебя уже подобрана оптимальная модель, ты будешь просто так еще раз писать весь пайплан со всеми препроцессингами и кросс-валидацией и заново подбирать те же самые гиперпараметры, но уже на питоне с sklearn?
источник

AS

Alexander Semenov in R (язык программирования)
Andrey
ну а переделывать-то ты что будешь? У тебя уже подобрана оптимальная модель, ты будешь просто так еще раз писать весь пайплан со всеми препроцессингами и кросс-валидацией и заново подбирать те же самые гиперпараметры, но уже на питоне с sklearn?
Да. В МТС так делал.
источник

A

Andrey in R (язык программирования)
если именно за это платят, то почему бы и да?
источник

AS

Alexander Semenov in R (язык программирования)
Рискну предположить, что за такой сценарий платят чаще, чем за пиления mlr3 в прод.
источник

AS

Alexander Semenov in R (язык программирования)
Я к тому, что если нужен околопродовый фреймворк/комбайн для ML, то мне кажется более разумным изучать сразу python+sklearn, а не mlr3.

По крайней мере я планирую поступить именно так.
источник

A

Andrey in R (язык программирования)
Alexander Semenov
А есть какой-то консенсус по поводу того, что является лучшей книгой по мышиному обучению в R? Мне только Lantz на ум приходит.
я на это отвечал, при чем тут твои планы по самообразованию?
источник

AS

Alexander Semenov in R (язык программирования)
Я думал мы давно уже обсуждаем mlr3.
источник

A

Andrey in R (язык программирования)
если хочешь делать ML на R, то нужен или mlr3, или tidymodels. Если хочешь делать ML на питоне, топ книг по ML на R не нужен, как и сам R с его фреймворками
источник

A

Andrey in R (язык программирования)
если взяться за R, почитать ISL, затем убить полгода жизни на ESL, то да, после этого логично прийти именно к целесообразности изучения питона
источник

AS

Alexander Semenov in R (язык программирования)
Тут ключевое слово "околопродовый". Так-то любую модель я без проблем обучу в R, если надо "просто посмотреть".

Но если работодатель созрел и там реально что-то из ML пилится в прод, то зачем "инвестировать" в изучение mlr3, если там скорее всего уже всё на Python и проще уже тогда сразу пересесть на sklearn.
источник