Size: a a a

Natural Language Processing

2021 January 27

A

Anton in Natural Language Processing
Sergey Shulga
А что сейчас есть из открытого и свежего по переводу rus<>eng?
Я wmt19 юзаю на hugging face
источник

А

Андрей in Natural Language Processing
rewrite_types = [u'NN', u'NNS', u'JJ', u'JJS'] Подскажите пожалуйста где эти типы посмотреть.
источник

N

Natalia in Natural Language Processing
источник

А

Андрей in Natural Language Processing
спасибо
источник

AM

Aleksandr Mester in Natural Language Processing
Ребят, подскажите, у меет ли спейси на русском извлекать noun chunks? Если нет - не подскажете, умеет ли кто-то вообще?
источник

KS

Konstantin Smith in Natural Language Processing
Aleksandr Mester
Ребят, подскажите, у меет ли спейси на русском извлекать noun chunks? Если нет - не подскажете, умеет ли кто-то вообще?
Как я понимаю, это именные группы (существительное с возможными прилагательными, согласованными с ним морфологически). Например, в Pullenti есть Pullenti.Ner.Core.NounPhraseHelper и функция TryParse, которая может попытаться выделить именную группу, оформленную классом NounPhraseToken, с указанного токена. Есть и для глагольных групп аналоги VerbPhraseHelper и VerbPhraseToken.
источник

AM

Aleksandr Mester in Natural Language Processing
спасибо
источник

YB

Yuri Baburov in Natural Language Processing
Aleksandr Mester
Ребят, подскажите, у меет ли спейси на русском извлекать noun chunks? Если нет - не подскажете, умеет ли кто-то вообще?
spacy-ru умеет выделять noun-chunks, но не идеально. сам POS и DEP хорошо работает, а вот реализация поиска noun-chunks в самом spacy хромает, даже на английском (русский порт для поиска noun-chunks я сделал давным давно.)
примеры, где он ошибается, мы в прошлые выходные нашли. думаю, в эти выходные допилим реализацию.
вот промежуточный ноутбук: https://colab.research.google.com/drive/1EY0eL8Dfj7EuvUyR0fhJ4OyutwW4IZhT?usp=sharing
если кто желает доделать, пишите мне.
источник

AW

Alex Wortega in Natural Language Processing
Товарищи админы, я тут тиндер откачиваю, залить в наташу?
источник

PV

Peter Vanin in Natural Language Processing
Alex Wortega
Товарищи админы, я тут тиндер откачиваю, залить в наташу?
"откачивать" это..?
источник

AW

Alex Wortega in Natural Language Processing
Peter Vanin
"откачивать" это..?
парсить
источник

YB

Yuri Baburov in Natural Language Processing
Alex Wortega
Товарищи админы, я тут тиндер откачиваю, залить в наташу?
в corus ? всё заливай, что найдёшь. пригодится.
источник

SS

Sergey Shulga in Natural Language Processing
А есть русский TREC по какой-нибудь тематике?
источник

AB

Aljona Barbanova in Natural Language Processing
здравствуйте, кто-нибудь работал с библиотекой Natasha?
источник

AB

Aljona Barbanova in Natural Language Processing
источник

PL

Pavel Lebedev in Natural Language Processing
добрый! подскажите, есть ли открытые базы с семантическими полями понятий русского языка? условно, у меня есть термин «игра» мне надо посмотреть поле ассоциирущихся с ним у людей/в каком-то корпусе слов и, возможно, какую-то их кластеризацию/классификацию.
источник

RS

Roman Samarev in Natural Language Processing
Dbpedia, wikidata?
источник

A

Anton in Natural Language Processing
Aljona Barbanova
здравствуйте, кто-нибудь работал с библиотекой Natasha?
Да, сейчас решаю похожую задачу.
источник

AB

Aljona Barbanova in Natural Language Processing
Anton
Да, сейчас решаю похожую задачу.
У Вас получилось результат addrExtractor интерпретировать? Я имею ввиду записать в строку, например?
источник

A

Anton in Natural Language Processing
for match in matches:
 for val in match:
   val.token
источник