Size: a a a

Natural Language Processing

2021 August 09

TM

Toemik Mnemonic in Natural Language Processing
Внёс вклад в российскую науку
источник

TM

Toemik Mnemonic in Natural Language Processing
Я неверно сказал , я про некий app.py. Но не важно , путь был корректен но не полон ))
источник
2021 August 10

DS

Daniyar S in Natural Language Processing
Если это на долгий срок, я бы lucene прикрутил.
источник

DS

Daniyar S in Natural Language Processing
Если опечатки известны заранее, можно просто regexp
источник

K

Kutuz4 in Natural Language Processing
А есть что-то похожее на InferSent (эмбеддинги предложений от фейсбука), но для русского языка?
источник

RP

Rodion Proskuryakov in Natural Language Processing
Можете попробовать мультиязычный USE https://tfhub.dev/google/universal-sentence-encoder-multilingual/3
источник

B

Bruddah in Natural Language Processing
источник

K

Kutuz4 in Natural Language Processing
Спасибо
источник

K

Kutuz4 in Natural Language Processing
А может ещё тут есть кто-то, кто знает о датасете синонимов на русском языке?
источник

K

Kutuz4 in Natural Language Processing
Синонимы состоящие из 3-4 слов
источник

K

Kutuz4 in Natural Language Processing
Максимум. Пример: аэратор - ситечко для ванны
источник

K

Kutuz4 in Natural Language Processing
https://github.com/dkulagin/kartaslov/tree/master/dataset/assoc нашел вот, но не уверен что это то, что нужно
источник

DD

David Dale in Natural Language Processing
ruwordnet
источник

AS

Anton Shevchuk in Natural Language Processing
Коллеги, привет! Мб кто-нибудь разбирался/сравнивал, какой сейчас SOTA подход для задачи кластеризации? Мне только приходит в голову SBERT + Kmeans поверх его нормализованных эмбеддингов
источник

DD

David Dale in Natural Language Processing
SOTA единого нет, ибо задачи для кластеризации очень разные. Но вообще подход "твой любимый sentence encoder" (SBERT/LaBSE/USE/Laser/...)" + "твой любимый кластеризатор" (kmeans/dbscan/birch/...) работает норм.
источник

AP

Anna Pshenichnikova in Natural Language Processing
Всем привет) Кто-нибудь знает, почему spacy в предложении To smoke is bad for health. определяет POS слова smoke как NOUN, а не VERB? И как с этим бороться?
источник

E

Elena in Natural Language Processing
а откуда эта фраза?
источник

AP

Anna Pshenichnikova in Natural Language Processing
Просто отдельное предложение взято, без контекста
источник

RI

Radmir Ibragimov in Natural Language Processing
To он при этом как-то определяет? Или дает ли выбрать варианты для smoke?
источник

RI

Radmir Ibragimov in Natural Language Processing
Smoke он определяет как дым, не как курить, как-то можно ему указать верный контекст?
источник