Lyubov К.
Всем привет! Нужно разбить датасет с текстами на кластеры по причине отказа в оказании услуги. Могли бы вы порекомендовать как это лучше сделать?
собери кучу данных о том, как это делают люди. 10к примеров набери, типа текст + причина отказа.
когда это будет - натренировать классификатор. можно взять любую обученную на нужном языке нейронку. переводы, продолжение текста - все такое скорее всего будет работать лучше чем тренировать с нуля.
в конечном итоге тебе нужен будет tensorflow и последний (полносвязанный) слой в котором столько нейронов, сколько у тебя классов. и брать тот нейрон что активен максимально.