Друзья, всем привет!) 👋
В рамках работы над задачей текстовой классификации вам скорее всего приходилось сталкиваться с ситуацией, когда перед применением тяжеловесных моделей вы строите бейзлайн TF-IDF + LogReg. 📈
Несмотря на то, что это стандартная модель, ее построение с помощью sklearn занимает определенное количество времени, будь то написание ее с нуля, или копирование и адаптация кода из другого проекта с аналогичной задачей. ⏱️
Я сталкивался не раз с такой ситуацией, поэтому решил написать пайплайн, который позволяет обучить такую модель с помощью всего двух команд:
1. установка пайплайна:
pip install text-classification-baseline
2. запуск пайплайна:
text-clf-train --path_to_config config.yaml
Параметризация модели происходит с помощью файла config.yaml.
Надеюсь, что данный пайплайн будет полезен не только мне. 😇
Ссылка не репозиторий:
https://github.com/dayyass/text-classification-baseline