Size: a a a

R (язык программирования)

2021 March 08

ЕТ

Евгений Томилов... in R (язык программирования)
Иван Поздняков
Ну, просто в самой функции будет и поиск лямбды и ее использование в формуле преобразования. А то все туториалы по трансформации получается из-за этого очень длинные и даже используют по два разных пакета, хотя пользователю обычно не особо нужно где-то лямбду сохранять
источник

ИП

Иван Поздняков... in R (язык программирования)
Там как-то сложно, но надо посмотреть, я не очень знаком с этим пакетом
источник

A

Andrey in R (язык программирования)
Иван Поздняков
Ну, просто в самой функции будет и поиск лямбды и ее использование в формуле преобразования. А то все туториалы по трансформации получается из-за этого очень длинные и даже используют по два разных пакета, хотя пользователю обычно не особо нужно где-то лямбду сохранять
так делать точно не надо, т.к. правильным подходом является обучать параметры преобразования на обучающих данных и применять на обучающих и тестовых/проверочных.
источник

ЕТ

Евгений Томилов... in R (язык программирования)
+++

В recipe мы создаём сначала план преобразований, который "обучен" на трейне, в том числе подбираем лямбды, сохраняем минимумы и максимумы и прочие параметры. А потом это уже применяем на тест.
источник

A

Andrey in R (язык программирования)
в mlr3 (точнее, mlr3pipelines) все это тоже есть, кстати https://mlr3pipelines.mlr-org.com//reference/mlr_pipeops_yeojohnson.html
источник

ЕТ

Евгений Томилов... in R (язык программирования)
Вот, чисто субъективное мнение, но такое ощущение, что mlr3 — косплей на sklearn.
источник

A

Andrey in R (язык программирования)
это sklearn v.2.0
источник

ИП

Иван Поздняков... in R (язык программирования)
Andrey
так делать точно не надо, т.к. правильным подходом является обучать параметры преобразования на обучающих данных и применять на обучающих и тестовых/проверочных.
Я просто не про ML контекст говорю, вне его не очень понимаю зачем такие сложности
источник

A

Andrey in R (язык программирования)
Евгений Томилов
Вот, чисто субъективное мнение, но такое ощущение, что mlr3 — косплей на sklearn.
и tidymodels тоже приобретает все большее конвергентное сходство с ними
источник

A

Andrey in R (язык программирования)
Иван Поздняков
Я просто не про ML контекст говорю, вне его не очень понимаю зачем такие сложности
а вне контекста ML где это все надо?
источник

ЕТ

Евгений Томилов... in R (язык программирования)
Andrey
и tidymodels тоже приобретает все большее конвергентное сходство с ними
Вот, sklearn почему-то более понятным синтаксисом обладает, как по мне. Хотя, возможно, я просто ещё не особо погружался в mlr3, но навскидку выглядит пугающе: объекты эти все, странные интерфейсы к ним.
источник

ЕТ

Евгений Томилов... in R (язык программирования)
Надо попробовать.
источник

ИП

Иван Поздняков... in R (язык программирования)
Andrey
а вне контекста ML где это все надо?
Да просто для разных статистических тестов, например
источник

PU

Philipp Upravitelev in R (язык программирования)
Иван Поздняков
Да просто для разных статистических тестов, например
мне всегда дополнительные трансформации казались каким-то слишком хитрым трюком, честно говоря
источник

IY

Igor Yakubovskiy in R (язык программирования)
Да, там интерпретация плывёт сразу
источник

IY

Igor Yakubovskiy in R (язык программирования)
Но где то читал, что нормальность регрессоров позволяет получить более стабильные результаты
Но это не точно)
источник

SG

Sergey Gumerov in R (язык программирования)
Коллеги,
чем можно восстановить кодировку в коде R, если reopen with enncoding уже никак не помогает 🙂

# ???????????????? ?????????????? ?????? ???????????????????? ???????????? ????????         ####
источник

ЕТ

Евгений Томилов... in R (язык программирования)
Sergey Gumerov
Коллеги,
чем можно восстановить кодировку в коде R, если reopen with enncoding уже никак не помогает 🙂

# ???????????????? ?????????????? ?????? ???????????????????? ???????????? ????????         ####
Нужно перебрать все сочетания encoding файла и кодировки проекта.
источник

SG

Sergey Gumerov in R (язык программирования)
про encoding кроме UTF-8 и Win-1251 ничего не использовал и даже не понимаю какая кодировка с русским языком может случиться. Вчера еще все было нормально.
источник

SG

Sergey Gumerov in R (язык программирования)
вообще не реагирует на перебор кодировок
Mac os пишет про файл  - Non-ISO extended-ASCII text, with very long lines
источник