2. Надо понять, по каким правилам мы будем считать запросы подходящими для сбора в кластер
нам ваще ничо не надо. иди просто сделай парочку проверок в секрвисах. как я выше сказал и убедишься, что любой сервис выдает полурандомные резултаты на кластеризации
возьми проведи эксперимент. возьми один набор запросов. одни настройки кластеризатора. и с разбивкой скажем в час проведи кластеризацию любым сервисом. получишь на выходе соверешнно разные кластеры