Телеграмм чат группы natural_language_processing страница 836

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Natural Language Processing

2106 membersпожаловаться на группу

2020 September 15

BS

Bogdan Salyp in Natural Language Processing

Ребят, что посоветуете для similarity предложений на русском языке? Попробовал ru2, но в нем нет векторов. Пробовал sent2vec, но нет предобученной модели на русском. В StanfordNLP Similarity очевидными способами посчитать нельзя. В deeppavlov дискретные значения 0 и 1, а нужно на отрезке. Часа четыре сижу, пока не очень успешно :с

В поиске по старым сообщениям беседы не нашел готовый инструмент

источник

01:39пожаловаться #1

М

Марк in Natural Language Processing

Ребят, что посоветуете для similarity предложений на русском языке? Попробовал ru2, но в нем нет векторов. Пробовал sent2vec, но нет предобученной модели на русском. В StanfordNLP Similarity очевидными способами посчитать нельзя. В deeppavlov дискретные значения 0 и 1, а нужно на отрезке. Часа четыре сижу, пока не очень успешно :с

В поиске по старым сообщениям беседы не нашел готовый инструмент

Fast text. И косинусное расстояние. Стандартный base model.

источник

02:21пожаловаться #2

BS

Bogdan Salyp in Natural Language Processing

Хм, то есть нормально работает усреднить вектора всех слов в предложении?

источник

02:22пожаловаться #3

М

Марк in Natural Language Processing

Хм, то есть нормально работает усреднить вектора всех слов в предложении?

Да, в полне.

источник

02:22пожаловаться #4

BS

Bogdan Salyp in Natural Language Processing

sent2vec на русском предобученный не нашел

источник

02:22пожаловаться #5

BS

Bogdan Salyp in Natural Language Processing

Хорошо, спасибо! Попробую и отпишусь

источник

02:22пожаловаться #6

D

Dmitry in Natural Language Processing

Fast text. И косинусное расстояние. Стандартный base model.

++

источник

02:37пожаловаться #7

DP

Defragmented Panda in Natural Language Processing

зафайнтюнить в случае гпт-2

https://transformer.huggingface.co/

gpt2 тоже достаточно скормить текст-затравку по-моему

transformer.huggingface.co

Write With Transformer

See how a modern neural network auto-completes your text

источник

05:08пожаловаться #8

DD

David Dale in Natural Language Processing

Ребят, что посоветуете для similarity предложений на русском языке? Попробовал ru2, но в нем нет векторов. Пробовал sent2vec, но нет предобученной модели на русском. В StanfordNLP Similarity очевидными способами посчитать нельзя. В deeppavlov дискретные значения 0 и 1, а нужно на отрезке. Часа четыре сижу, пока не очень успешно :с

В поиске по старым сообщениям беседы не нашел готовый инструмент

USE и Laser - мультиязычные энкодеры предложений, поддерживающие в т.ч. русский.
А ещё можно взять в диппавлове SentenceBERT - это BERT, пофайнтюненный на NLI, и он тоже неплохие эмбеддинги предложений даёт.
Fasttext действительно на удивление сильный бейзлайн, но он даже теоретически порядок слов не учитывает, а эти ребята хотя бы пытаются. На каких-то задачах это может быть важно.

источник

08:38пожаловаться #9

M

Mishanya in Natural Language Processing

Ребят, что посоветуете для similarity предложений на русском языке? Попробовал ru2, но в нем нет векторов. Пробовал sent2vec, но нет предобученной модели на русском. В StanfordNLP Similarity очевидными способами посчитать нельзя. В deeppavlov дискретные значения 0 и 1, а нужно на отрезке. Часа четыре сижу, пока не очень успешно :с

В поиске по старым сообщениям беседы не нашел готовый инструмент

Sentence RuBERT есть же https://huggingface.co/DeepPavlov/rubert-base-cased-sentence. Его + косинусное расстояние

DeepPavlov/rubert-base-cased-sentence · Hugging Face

We’re on a journey to solve and democratize artificial intelligence through natural language.

источник

13:34пожаловаться #10

BS

Bogdan Salyp in Natural Language Processing

Действительно, спасибо, забыл, что у диппавлова есть по предложениям модель)

источник

13:46пожаловаться #11

МА

Михаил Адьянов... in Natural Language Processing

Здравствуйте, я студент первого курса и получил на проектной практике тему "Автоматическая генерация образовательных тестов на основе семантического анализа текста". Так как в проге я абсолютный ноль данная задача ввела меня в ступор. Можете подсказать, что поможет мне в решении этой задачи(статьи, описания готовых проектов, библиотеки и датасеты)

источник

13:50пожаловаться #12

SK

Sasha Korovii in Natural Language Processing

Такой вопрос, какую лучше метрику использовать inner product или L2 при сравнении двух ембедингов из заголовков новостей (использую FAISS, как для хранения и поиска векторов)?

источник

13:54пожаловаться #13

FF

Futorio Franklin in Natural Language Processing

Такой вопрос, какую лучше метрику использовать inner product или L2 при сравнении двух ембедингов из заголовков новостей (использую FAISS, как для хранения и поиска векторов)?

inner product, он как раз и является характеристикой семантической близости двух эмбеддингов

источник

14:00пожаловаться #14

KL

Kir L in Natural Language Processing

Такой вопрос, какую лучше метрику использовать inner product или L2 при сравнении двух ембедингов из заголовков новостей (использую FAISS, как для хранения и поиска векторов)?

ты сам по докам настроил faiss или есть под рукой хороший туториал? я чет с трудом понимаю, что там использовать для своей задачи и как, туповат (((

источник

14:02пожаловаться #15

SK

Sasha Korovii in Natural Language Processing

ты сам по докам настроил faiss или есть под рукой хороший туториал? я чет с трудом понимаю, что там использовать для своей задачи и как, туповат (((

pip3 install faiss-cpu все нормально
но у меня mac, там ошибки есть связание с версиями omp : os.environ['KMP_DUPLICATE_LIB_OK'] = 'True'

источник

14:08пожаловаться #16

VR

Vladimir R in Natural Language Processing

речь про движение денежных средств?

источник

16:26пожаловаться #17

VR

Vladimir R in Natural Language Processing

это же закрытая финансовая информация

источник

16:26пожаловаться #18

VR

Vladimir R in Natural Language Processing

или есть договор и нужно из него получить строки со счетами и платежами?

источник

16:27пожаловаться #19

VR

Vladimir R in Natural Language Processing

вы так формулируете - есть компания и нужно найти про нее компромат по свей сети, или нужно наоборот подсветить из письменного документа NERы

источник

16:28пожаловаться #20