Size: a a a

Natural Language Processing

2021 September 08

OP

Oleg Polivin in Natural Language Processing
привет! а кто-нибудь знает, существуют ли хорошие многоязычные POS taggerы? Те, что я встречаю - либо одноязычные, как SpaCy, либо не имеют нужных мне языков.
источник

DS

Dmitry Spodarets in Natural Language Processing
Всем привет! Сегодня вечером проводим практический вебинар про деплой ML моделей при помощи Kubernetes и Kubeflow - https://dataphoenix.info/webinar-deploying-deep-learning-models-with-kubernetes-and-kubeflow/
Присоединяйтесь 😉
источник

Eg

Elena gisly in Natural Language Processing
куча отдельных языков есть тут: https://github.com/orgs/apertium/repositories
источник

OP

Oleg Polivin in Natural Language Processing
изучаю, спасибо большое!
источник

ck

cnstntn kndrtv in Natural Language Processing
Привет. Задавал уже тут вопрос ранее. Решаем задачу NER. Ищем город в тексте "Нижний, мать его, Новгород".
Как эти 2 токена собрать в 1? Я решил на алгоритме max flow min cost. Так как это отлично вписывается в мои технологии (Semantic web, KG и прочее), и в моем случае это поиск по словарю.
Может как-то нейронки обучают работать с такими "разорванными" тегами? Сомневаюсь что датасеты есть для такой задачи.
источник

A

Andrey in Natural Language Processing
может словарно вырезать всякие промежуточные маты?
источник

ck

cnstntn kndrtv in Natural Language Processing
Это не решает задачу глобально - в русском свободный порядок слов и такие разрывы тоже допустимы, не только с матом.
источник

AS

Artem Sergeev in Natural Language Processing
ну вот Deeppavlov как минимум понимает, что "Нижний" это неспроста:
источник

AS

Artem Sergeev in Natural Language Processing
и тут мне кажется уже словарь локаций
чтобы от "Нижнего Волочка" отличать
источник

ck

cnstntn kndrtv in Natural Language Processing
Тут 2 «цепочки» тегов. Нижний и Новгород - это B-loc, а должно быть Новгород I-loc.
То есть нужно делать ещё 1 слой, который эти 2 токена соберёт в 1 сущность
источник

AS

Artem Sergeev in Natural Language Processing
источник

AS

Artem Sergeev in Natural Language Processing
ну, как минимум есть loc. В словаре отдельная loc "Нижний" будет отсутствовать (надеюсь), и будет понятно, что надо поискать часть поблизости.
источник

N

Natalia in Natural Language Processing
udpipe, stanza
источник

AS

Artem Sergeev in Natural Language Processing
но есть, конечно, нюансы :/
источник

ПП

Павел Приказчиков... in Natural Language Processing
всем привет! подскажите плиз варианты перевода фраз  "двадцать второго декабря 2021" в datetime? есть ли работающие варианты кроме pullenty?
источник

A

Andrey in Natural Language Processing
dateparser пакет вроде во что-то такое хорошо, если слова в числа сделать (или даже нет, пробовать надо)
источник

A

Andrey in Natural Language Processing
не, в слова не может ((
источник

Eg

Elena gisly in Natural Language Processing
heideltime может
источник

OS

Oleg Serikov in Natural Language Processing
попробуйте сёрч вместо парс
источник

ПП

Павел Приказчиков... in Natural Language Processing
спасибо. отлично работает с месяцами, но вот дни прописью не понимает, search_dates тоже
источник