Телеграмм чат группы natural_language

Это да, вокруг косинуса там ещё софтмакс с зазором как лосс при обучении. На инференсе как меру близости пар предложений можно использовать просто косинус.

источник

13:27пожаловаться #10

SМ

SancheZz Мов in Natural Language Processing

Гуд

источник

13:27пожаловаться #11

SМ

SancheZz Мов in Natural Language Processing

Ага

источник

13:27пожаловаться #12

SМ

SancheZz Мов in Natural Language Processing

У меня тоже норм работает на тф

источник

13:28пожаловаться #13

SМ

SancheZz Мов in Natural Language Processing

Даже с пуллингом

источник

13:28пожаловаться #14

dePuff in Natural Language Processing

Мы в личке нашли косяк

источник

13:28пожаловаться #15

SМ

SancheZz Мов in Natural Language Processing

sticker.webp

(55.56 Кб)

источник

13:28пожаловаться #16

SМ

SancheZz Мов in Natural Language Processing

Я думал они на пуллинге тюнили, хорошие для cls получили результаты

источник

13:29пожаловаться #17

SМ

SancheZz Мов in Natural Language Processing

Попробую дотюнить аля сберт с пуллинга

источник

13:29пожаловаться #18

SМ

SancheZz Мов in Natural Language Processing

Интересно сравнить с cls тюнингом

источник

13:30пожаловаться #19

Oleg Durandin in Natural Language Processing

Коллеги, всем привет! Раз уж пошла тема про embedding’и — как считаете расстояния/схожесть между векторами?
Косинусное расстояние не всегда хорошо работает с длинными векторами, на мой взгляд.
В последнее время пробую через Annoy, но это требует создания индекса, но в целом достаточно неплохо. Может быть ещё есть какие-то сакральные знания?

P.S. Эмбеддинги от LABSE/BERT/USE

источник

13:33пожаловаться #20