Коллеги, всем привет! Раз уж пошла тема про embedding’и — как считаете расстояния/схожесть между векторами?
Косинусное расстояние не всегда хорошо работает с длинными векторами, на мой взгляд.
В последнее время пробую через Annoy, но это требует создания индекса, но в целом достаточно неплохо. Может быть ещё есть какие-то сакральные знания?
P.S. Эмбеддинги от LABSE/BERT/USE