Size: a a a

R (язык программирования)

2020 December 24

AC

Andrey C. in R (язык программирования)
Спасибо!
источник
2020 December 25

AS

Alexander Semenov in R (язык программирования)
У кого-нибудь есть под рукой иллюстрация того, почему с ростом AUC может не расти (а то и вовсе падать) Accuracy?
источник

I

I am in R (язык программирования)
а зачем тут иллюстрация ?
аук - ареа ундер курве, тоесть площадь под кривой, а сама кривая это правильно предсказанных на тестовых данных, а акураси - это уже обученный алгоритм на рабочих данных и тут фишка, что данных для обучения/настройки одного класса может быть больше, чем другого, а в тестовой группе может быть один класс и не быть другого :)
сделайте примеров классов равномерное для всех групп и посмотрите что получится :)
источник

I

I am in R (язык программирования)
источник

ЕТ

Евгений Томилов... in R (язык программирования)
Alexander Semenov
У кого-нибудь есть под рукой иллюстрация того, почему с ростом AUC может не расти (а то и вовсе падать) Accuracy?
Accuracy очень восприимчива к несбалансированности классов, а AUC не особо.
источник

AS

Alexander Semenov in R (язык программирования)
Ну вот у меня кейс, где баланс классов ~ 50/50. Я добавляю в модель фичи и AUC прирастает значительно (на ~ 8%), а Accuracy (на тех же тестовых данных) всего на 2% от силы.
источник

AS

Alexander Semenov in R (язык программирования)
Евгений Томилов
Accuracy очень восприимчива к несбалансированности классов, а AUC не особо.
Ну как сказать... при балансе 99/1 на AUC тоже особо смысла смотреть нет.
источник

ЕТ

Евгений Томилов... in R (язык программирования)
Alexander Semenov
Ну как сказать... при балансе 99/1 на AUC тоже особо смысла смотреть нет.
Ну, это уже совсем.
источник

ЕТ

Евгений Томилов... in R (язык программирования)
Alexander Semenov
Ну вот у меня кейс, где баланс классов ~ 50/50. Я добавляю в модель фичи и AUC прирастает значительно (на ~ 8%), а Accuracy (на тех же тестовых данных) всего на 2% от силы.
Может, ошибка где-то?
источник

I

I am in R (язык программирования)
так в тестовых тоже 50/50?
источник

AS

Alexander Semenov in R (язык программирования)
Евгений Томилов
Ну, это уже совсем.
А что "совсем"? Классика задач на предсказание оттока.
источник

I

I am in R (язык программирования)
и вообще дАук != дАссураси
источник

AS

Alexander Semenov in R (язык программирования)
I am
так в тестовых тоже 50/50?
Конечно.
источник

AS

Alexander Semenov in R (язык программирования)
I am
и вообще дАук != дАссураси
Ясен красен. Вопрос о том, почему AUC растет сильнее Accuracy.
источник

I

I am in R (язык программирования)
так блин, ты подбираешь данные на основе уже существующих данных, а тестируешь уже на других
Вообще это больше от качества данных завиит и от признаков которые ты напихал в модель
источник

AS

Alexander Semenov in R (язык программирования)
И? Я же Accuracy и AUC на тестовых данных смотрю.
источник

I

I am in R (язык программирования)
и всё )
так подобралось и возможно уже близко теоретическому возможному качеству, поэтому прирост такой мелкий :)
конкретные цифры какие ?
источник

AS

Alexander Semenov in R (язык программирования)
Просто мне чисто интуитивно казалось, что прирост AUC с 0,7 до 0,78 должен дать прирост Accuracy больший, чем 0,68 -> 0,7.
источник

I

I am in R (язык программирования)
нет, приращение аук != приращение аккураси :)
аук это площадь же, а аккураси некий коэф в среднем
как в анекдоте про капусту мясо и голубцы
источник

I

I am in R (язык программирования)
вот тут про рук хорошо написано:
dyakonov.org//2017/07/28/auc-roc-площадь-под-кривой-ошибок/
источник