Size: a a a

Мехмат МГУ

2021 May 11

S

Stig in Мехмат МГУ
/gpt3  Найдите генератрису та асимптотический рост для последовательности
источник

M

MSU Hub Bot in Мехмат МГУ
Найдите генератрису та асимптотический рост для последовательности.
источник

PS

Pavel Savin in Мехмат МГУ
Вроде всё есть в Кормене
источник

Р

Руслан in Мехмат МГУ
ну тебе надо чтобы в пространстве Bow/BERT эмбеддингов расстояние действительно было тем, которое ты замеряешь
источник

Р

Руслан in Мехмат МГУ
глянь sentence bert
источник

Р

Руслан in Мехмат МГУ
кажется, что для bow/tfidf косинусное расстояние норм
источник

AM

Aleksandr Markelenko... in Мехмат МГУ
не совсем понял, что значит расстояние = то, что я замеряю?  можешь пояснить плз?
upd.
а, имеется в виду что векторное пространство в которое происходит отображение, снабждено нужным мне расстоянием/метрикой? а как это понять? или обеспечить? скалряное=>косинусное же в любом случае будет для эмбеддингов? а другие?
источник

Р

Руслан in Мехмат МГУ
ну обычные BERT эмбеддинги не обучены на косинусное расстояние например
То есть "похожие" предложения не обязательно будут близки по cosine distance
источник

AM

Aleksandr Markelenko... in Мехмат МГУ
а по какому принципу понимать что модель предназчена/обучена на определенное расстояние d, или определять на какие?
т.е. допустим, я решаю задачу англ-язычная QA и хочу взять модель, например зайду сюда https://huggingface.co/models?pipeline_tag=question-answering
как понять и  выбрать какую-то из них, чтобы 1) там было расстояние d 2) она мне выдавала эмбеддинги, которые можно семантически сравнивать по d?
это надо отдельно искать по каждому bert/distilbert/xlm и понимать под что оно?
источник

AM

Aleksandr Markelenko... in Мехмат МГУ
и по какой метрике для bert тогда лучше сравнивать тексты? на медиуме вон cosine считают)
источник

I

Ilya in Мехмат МГУ
есть модификация берта через сиамские сети (sentence bert), посмотри его
источник

I

Ilya in Мехмат МГУ
там тренится на cosine как раз, поэтому логичнее всего брать её
источник

AK

Alexey Kolosov in Мехмат МГУ
Можно взять набор пар текстов, в которых эксперты определили величину семантического сходства

Затем на тех же парах получить сходство с помощью своей модели

Наконец, посчитать корреляцию Спирмена на получившихся последовательностях чисел
источник

I

Ilya in Мехмат МГУ
источник

I

Ilya in Мехмат МГУ
но из коробки на самом деле он работает так себе, так что если нет разметки (и денег на разметку),  чтобы его дообучить, то лучше смотри в сторону дефолтных методов типа tf-idf + cosine
источник

Р

Руслан in Мехмат МГУ
ты читал че я выше блять писал?
источник

Р

Руслан in Мехмат МГУ
соси
источник

I

Ilya in Мехмат МГУ
источник

I

Ilya in Мехмат МГУ
ну ладно
источник

PS

Pavel Savin in Мехмат МГУ
Шо за огресия такая
источник