Хз, я тоже не заморачиваюсь и снимаю вообще в кавычках, ибо всё равно какие-то вариации запросов могут мимо пройти и ядро будет меньше, а пробить ручками самые частотные на предмет словоформы и последовательности слов мне не лень
так то оно так, зависит от продукта. Если он большой то лучше все таки подрочить семантику но итерационно от самых маржинальных разделов, попутно собирая вопросы под фак, инфо под статейки и всякое такое
Это обычно бессмысленно, пробивать это имеет смысл только для самых частотных запросов в кластере, остальные запросы, которые являются производными, обычно будут иметь ту же самую словоформу и последовательность в базисе