сравнивая с текстами из топ выдачи?
или имеешь ввиду регулярками всякие кривые запросы вычищать?
У меня у Джуна скрипт, на вход идёт список ключевых слов с частотой, дальше вставляешь (пока что, стоп слова в прямом вхождении), и он удаляет строки где есть эти слова и перезаписывает список с частотой и ключами