Size: a a a

Natural Language Processing

2021 February 25

N

Natalia in Natural Language Processing
а оперировать значениями слов (особенно исходя из современных данных) — ещё более опасный путь, потому что они как раз отлично меняются с годами
источник

N

Natalia in Natural Language Processing
ммм, русский wiktionary, ни источников, ни ссылок
источник

N

Natalia in Natural Language Processing
но так просто и что? а в адресе?
источник

N

Natalia in Natural Language Processing
источник

N

Natalia in Natural Language Processing
источник

N

Natalia in Natural Language Processing
вообще etytree похоже на то, о чём спрашивалось
источник

N

Natalia in Natural Language Processing
а с другими целями можно поиграться с lingpy:
http://lingpy.org/
источник

AC

Alexander C in Natural Language Processing
Natalia
а с другими целями можно поиграться с lingpy:
http://lingpy.org/
👍👍👍
источник

NC

Nikolay Chudinov in Natural Language Processing
Mark
Для английского есть предобученный docTTTTTquery.
А для русского чем мутить? Word2vec по парам и потом логарифм сумм?
источник

M

Mark in Natural Language Processing
Nikolay Chudinov
А для русского чем мутить? Word2vec по парам и потом логарифм сумм?
Ну это будет работать только если у тебя есть база запросов. Без этого просто тут не решить. Как вариант перевести MT все на английский а потом обратно. Если рантайм важен то перевести msmarco, а потом на нем обучить docT5query (T5 можно на mT5 попробовать поменять)
источник

A

Anthony in Natural Language Processing
Всем привет! Подскажите, пожалуйста, а есть способы идентификции или приведения имен в "нормальные" формы? Например: ["Маша", "Машуля", "Машечка", "Maria" и тп] -> "Мария"
источник

Е

Егорка in Natural Language Processing
Anthony
Всем привет! Подскажите, пожалуйста, а есть способы идентификции или приведения имен в "нормальные" формы? Например: ["Маша", "Машуля", "Машечка", "Maria" и тп] -> "Мария"
Это подзадача Named entity recognition и Named entity normalization.
Natasha умеет такое.
источник

N

Natalia in Natural Language Processing
но вообще осторожно такое автоматизировать для некоторых задач, потому что а) бывают гипокористики с несколькими соответствиями (Ася — Александра или Анастасия? или вообще Анна? Шура — Александр или Александра?), б) у некоторых людей прямо в паспорте может быть написано "ненормальное" имя
источник

N

Natalia in Natural Language Processing
про то, что примерно половина людей не способна восстановить из латинского написания моего имени верный вариант Наталья, я тоже молчу
источник

ДК

Дмитрий Крючков... in Natural Language Processing
А как тогда пишется по латински Наталия?
источник

ДК

Дмитрий Крючков... in Natural Language Processing
через y?
источник

N

Natalia in Natural Language Processing
define "по-латински"
источник

N

Natalia in Natural Language Processing
или для вас латиница = английский?
источник

N

Natalia in Natural Language Processing
как где договорятся, так и пишут, это правила транслитерации
источник

N

Natalia in Natural Language Processing
а есть языки, где это имя по дефолту скорее НаталИя
источник