Борис Добров
Кластеризация это производное от группирования на основе общих свойств. Какие саойства важны и насколько, определяется постановкой задачи, а также свойствами коллекции. Сначала надо уточнить задачу, абстрактной кластеризации нет, т.к. тогда нет критерия
Да, меня попросили знакомые аналитики сделать им модель кластеризации. Простой фит предикт в целом неплохо работает. Есть слова, которые не характерезуют кластер, но записывает их в ключевые, есть пересекающиеся слова, по которым можно объеденить группу сообщений. Вот последнее не знаю, как можно сделать. Гуглю, но пока нахожу просто обучения кластеризации в общих словах