коротко, есть набор справочников, и запросы вида "по тому-то", где "то-то" - спраовчное значение, еще или запросы вида "по 'названию справочника' значению". справочники динамические, и некоторые из них содержат сотни тысяч значений.
через rubert-tiny векторизуются быстро, около минуты, ну а дальше косинусное сходство.
например, один из справочниов регионы, и запросы вида "по региону Лениград", или "по московской обл".