Я читал в инете что naive bayes лучше всего подходит. Но на деле оказалось он полный тормоз
предобработка с нормализацией текста + TF-IDF векторизация + SVM нормальный вариант для текста. Еще можно попробовать FastText и их модель собственную для классификации
Ребят какие модели лучше всего подходят для классификации текста? Важна скорость
Код для питонячьего sklearn: make_pipeline(CountVectorizer(), LogisticRegression()). Иногда этот бейзлайн сложно большими нейронками по качеству побить)
предобработка с нормализацией текста + TF-IDF векторизация + SVM нормальный вариант для текста. Еще можно попробовать FastText и их модель собственную для классификации
нет, оверхед после сегментирования слов больше чем для БАйеса, мы же скорость рассматриваем
предобработка с нормализацией текста + TF-IDF векторизация + SVM нормальный вариант для текста. Еще можно попробовать FastText и их модель собственную для классификации
я почти также делал только использовал bag of words instead of td-idf