Size: a a a

Natural Language Processing

2020 September 10

VS

Valera Sarapas in Natural Language Processing
Посоветуйте какую метрику лучше выбрать.
Есть задача классификации комментариев. Датасет очень сильно не сбалансирован. Всего 4-ре класса. И распределение по классам примерно 700, 200, 40, 6.
Какую лучше выбрать метрику для оценки качества классификации?
источник

s

sasha in Natural Language Processing
Valera Sarapas
Посоветуйте какую метрику лучше выбрать.
Есть задача классификации комментариев. Датасет очень сильно не сбалансирован. Всего 4-ре класса. И распределение по классам примерно 700, 200, 40, 6.
Какую лучше выбрать метрику для оценки качества классификации?
в датасете всего 946 семплов?
источник

E

Elena in Natural Language Processing
Valera Sarapas
Посоветуйте какую метрику лучше выбрать.
Есть задача классификации комментариев. Датасет очень сильно не сбалансирован. Всего 4-ре класса. И распределение по классам примерно 700, 200, 40, 6.
Какую лучше выбрать метрику для оценки качества классификации?
F-score и смотреть по каждому классу. И лучше сделать оверсемплинг маленьких классов.
источник

VS

Valera Sarapas in Natural Language Processing
sasha
в датасете всего 946 семплов?
Да, датасет маленький
источник

VS

Valera Sarapas in Natural Language Processing
Elena
F-score и смотреть по каждому классу. И лучше сделать оверсемплинг маленьких классов.
Ну взял я F-меру по каждому классу, а дальше. Если после переобучения по одному классу метрика упала,а по другому поднялась?
источник

E

Elena in Natural Language Processing
так видно, какой класс страдает больше всего
источник

E

Elena in Natural Language Processing
и с ним что-то делать
источник

E

Elena in Natural Language Processing
хотя и так понятно
источник

E

Elena in Natural Language Processing
класс с 6 семплами будет всегда плохо определяться, потому что модель не учится
источник

VS

Valera Sarapas in Natural Language Processing
Да, понятно, что можно посмотреть в каком классе есть проблемы.
Но мне нужно принимать решение о выкате новой модели в продакшен. И тут желательно интегральная метрика.
источник

БД

Борис Добров... in Natural Language Processing
Это школярская постановка задачи. Формальное решение, особенно на таком маленьком датасете будет бесполезно, с маленьким качеством на реальном потоке.
Надо решать бизнес задачу, и под неё набирать соответствующим образом коллекцию
источник

E

Elena in Natural Language Processing
Valera Sarapas
Да, понятно, что можно посмотреть в каком классе есть проблемы.
Но мне нужно принимать решение о выкате новой модели в продакшен. И тут желательно интегральная метрика.
средний ф-скор дает представление о двух метриках, реколл и пресижн. а accuracy вообще не нужно тут
источник

VS

Valera Sarapas in Natural Language Processing
Борис Добров
Это школярская постановка задачи. Формальное решение, особенно на таком маленьком датасете будет бесполезно, с маленьким качеством на реальном потоке.
Надо решать бизнес задачу, и под неё набирать соответствующим образом коллекцию
Такой маленький датасет именно из-за того, что это реальный поток комментариев
источник

E

Elena in Natural Language Processing
какая разница, какой поток? классифицировать-то точно надо любой поток
источник

AW

Alex Wortega in Natural Language Processing
У меня есть обученный LSI,  каким образом я могу данные на который обучал разлейблить типа вот один топик, вот другпй? Смотрел репа news-viz , не нашел к них. Есть какие то примеры?
источник

VS

Valera Sarapas in Natural Language Processing
Elena
средний ф-скор дает представление о двух метриках, реколл и пресижн. а accuracy вообще не нужно тут
Я вот думаю о взвешенном пропорционально колличеству выборок в датасете.
источник

E

Elena in Natural Language Processing
ф-скор разный, есть средний, а есть средний взвешенный, как угодно
источник

БД

Борис Добров... in Natural Language Processing
Valera Sarapas
Такой маленький датасет именно из-за того, что это реальный поток комментариев
Это такой уникальный бизнес?
Найдите в дзене или в новостях (яндекс, рамблер) близкое с комментариями.
источник

VS

Valera Sarapas in Natural Language Processing
Ну датасет для обучения я увеличу. Но мерять качество нужно на реальных данных все равно.
источник

БД

Борис Добров... in Natural Language Processing
Комментарии очень разнообразны. Нужна коллекция от 100 тысяч, а лучше миллиоеы
источник