Привет всем.
Подскажите, пожалуйста, какой библиотекой python решить задачу. Мне нужно превращать мультиязычные тексты неизвестной заранее длины в векторы одного размера. При этом:
1. Я не имею всех текстов заранее
2. Новые тексты могут сильно отличаться от уже известных
3. Я могу позволить на проде не сложную предобработку
4. Векторы будут использоваться для поиска похожих
Пока планирую использовать hnswlib, чтобы составлять, хранить и делать запросы к индексу.
Если это какая-то стандартизированная задача, то подскажите ее название, чтобы я мог погуглить бэйслайны.