Телеграмм чат группы natural_language_processing страница 1377

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Natural Language Processing

3198 membersпожаловаться на группу

2021 August 09

TM

Toemik Mnemonic in Natural Language Processing

Внёс вклад в российскую науку

источник

20:08пожаловаться #1

TM

Toemik Mnemonic in Natural Language Processing

Я неверно сказал , я про некий app.py. Но не важно , путь был корректен но не полон ))

источник

20:10пожаловаться #2

2021 August 10

DS

Daniyar S in Natural Language Processing

Если это на долгий срок, я бы lucene прикрутил.

источник

05:12пожаловаться #3

DS

Daniyar S in Natural Language Processing

Если опечатки известны заранее, можно просто regexp

источник

05:13пожаловаться #4

K

Kutuz4 in Natural Language Processing

А есть что-то похожее на InferSent (эмбеддинги предложений от фейсбука), но для русского языка?

источник

10:20пожаловаться #5

RP

Rodion Proskuryakov in Natural Language Processing

Можете попробовать мультиязычный USE https://tfhub.dev/google/universal-sentence-encoder-multilingual/3

источник

10:33пожаловаться #6

B

Bruddah in Natural Language Processing

https://github.com/dayyass/muse-as-service

GitHub - dayyass/muse-as-service: REST API for sentence tokenization and embedding using Multilingual Universal Sentence Encoder.

REST API for sentence tokenization and embedding using Multilingual Universal Sentence Encoder. - GitHub - dayyass/muse-as-service: REST API for sentence tokenization and embedding using Multilingu...

источник

10:47пожаловаться #7

K

Kutuz4 in Natural Language Processing

Спасибо

источник

11:14пожаловаться #8

K

Kutuz4 in Natural Language Processing

А может ещё тут есть кто-то, кто знает о датасете синонимов на русском языке?

источник

11:14пожаловаться #9

K

Kutuz4 in Natural Language Processing

Синонимы состоящие из 3-4 слов

источник

11:15пожаловаться #10

K

Kutuz4 in Natural Language Processing

Максимум. Пример: аэратор - ситечко для ванны

источник

11:15пожаловаться #11

K

Kutuz4 in Natural Language Processing

https://github.com/dkulagin/kartaslov/tree/master/dataset/assoc нашел вот, но не уверен что это то, что нужно

kartaslov/dataset/assoc at master · dkulagin/kartaslov

Открытые лингвистические датасеты: тональный словарь русского языка, датасет по семантике, ассоциативный граф и датасет по орфографическим ошибкам и опечаткам. - kartaslov/dataset/assoc at master ·...

источник

11:17пожаловаться #12

DD

David Dale in Natural Language Processing

ruwordnet

источник

11:27пожаловаться #13

AS

Anton Shevchuk in Natural Language Processing

Коллеги, привет! Мб кто-нибудь разбирался/сравнивал, какой сейчас SOTA подход для задачи кластеризации? Мне только приходит в голову SBERT + Kmeans поверх его нормализованных эмбеддингов

источник

11:43пожаловаться #14

DD

David Dale in Natural Language Processing

SOTA единого нет, ибо задачи для кластеризации очень разные. Но вообще подход "твой любимый sentence encoder" (SBERT/LaBSE/USE/Laser/...)" + "твой любимый кластеризатор" (kmeans/dbscan/birch/...) работает норм.

источник

11:55пожаловаться #15

AP

Anna Pshenichnikova in Natural Language Processing

Всем привет) Кто-нибудь знает, почему spacy в предложении To smoke is bad for health. определяет POS слова smoke как NOUN, а не VERB? И как с этим бороться?

источник

12:06пожаловаться #16

E

Elena in Natural Language Processing

а откуда эта фраза?

источник

12:08пожаловаться #17

AP

Anna Pshenichnikova in Natural Language Processing

Просто отдельное предложение взято, без контекста

источник

12:09пожаловаться #18

RI

Radmir Ibragimov in Natural Language Processing

To он при этом как-то определяет? Или дает ли выбрать варианты для smoke?

источник

12:10пожаловаться #19

RI

Radmir Ibragimov in Natural Language Processing

Smoke он определяет как дым, не как курить, как-то можно ему указать верный контекст?

источник

12:11пожаловаться #20