да ладно!? почему так?( ЮЗик же из коробки как описано на хабе работает нормально, одна была проблема - tensorflow_text не было под винду, то есть надо было станцевать, развернув ЮЗ на линукс машине как сервис, не более. что именно не получалось?
Попробовал Labse. Взял исходный короткий запрос, взял два длинных + один короткий, но совершенно не подходящий по смыслу. Посчитал расстояния между эмбеддингами. В итоге короткий неподходящий запрос оказался самым близким к "монтаж инженерных коммуникаций в доме" оказался "рыбный салат". Чем в нем инициализируются слова, которых нет в словаре? Они выкидываются?