Не. Это то, что работает.
Про прототип не дописал. Мы доделывали для 1 проекта дополнительный фокус. Собирали не только сами заголовки, но и тексты под ними и сравнивали их между собой. То есть если заголовки разные, но тексты под ними схожи на 70%+, то скорее всего это синонимы. И это просто +1 этап. но так и не добрались добавить эту штуку в Бонику.
Интересная реализация!
p.s. Но больше интересен подход как такое сравнение работает (на 70%)? (стемер портера, через яндекс.мустим, машинное обучение)?
p.s.s. не конкурент, просто интересующийся.