Size: a a a

Natural Language Processing

2020 September 23

AW

Alex Wortega in Natural Language Processing
Товарищи у кого то было что pymorphy2 не видит на коллабе свои словари?
источник

AW

Alex Wortega in Natural Language Processing
Вот такая штука
источник

YS

Yehor Smoliakov in Natural Language Processing
Roman Demyanchuk
Привет всем, я новичок в теме NLP

Подскажите пожалуйста, пишу rules по работе с адресами на украиском языке, рулы странным образом вообще не работают, подскажите пожалуйста, куда тут можно копать чтобы разобраться?
источник

YS

Yehor Smoliakov in Natural Language Processing
украинский поддерживает libpostal
источник

YS

Yehor Smoliakov in Natural Language Processing
Переслано от Yehor Smoliakov
источник

М

Мария in Natural Language Processing
Alex Wortega
Товарищи у кого то было что pymorphy2 не видит на коллабе свои словари?
Да, поставила предыдущую версию пайморфи
источник

YB

Yuri Baburov in Natural Language Processing
Alex Wortega
Товарищи у кого то было что pymorphy2 не видит на коллабе свои словари?
Все ругаются. Поломалось. Надо бы опять найти Мишу Коробова, автора pymorphy, что появился, выкатил апдейт, который ломается, и пока что не отвечает на issue.
А лучше -- если кто-нибудь разберётся и пришлет патч.
https://github.com/kmike/pymorphy2/issues/131
источник

AW

Alex Wortega in Natural Language Processing
Я в ручную давал ему директорию он просто рипнулся
источник
2020 September 24

IM

IVAN MALAKHOV in Natural Language Processing
источник

ГС

Генрих Скретч... in Natural Language Processing
Есть что-то полезное для правки ошибок в тексте на русском?
источник

SZ

Sergey Zhuravlev in Natural Language Processing
Подскажите какой инструмент используется для того, чтобы расшифровывать сокращения в тексте? Я правильно понимаю, что это не в сторону спел чекера надо смотреть? Или готового инструмента нет и надо с нуля свой писать?
источник

T

Teemoor in Natural Language Processing
Генрих Скретч
Есть что-то полезное для правки ошибок в тексте на русском?
jamspell?
источник

V

Vlad in Natural Language Processing
Sergey Zhuravlev
Подскажите какой инструмент используется для того, чтобы расшифровывать сокращения в тексте? Я правильно понимаю, что это не в сторону спел чекера надо смотреть? Или готового инструмента нет и надо с нуля свой писать?
https://github.com/bakwc/JamSpell/issues/69

Мы у себя используем и от пары человек тоже слышал, что модель в целом хорошая получилась :)
источник

V

Vlad in Natural Language Processing
Главное если будете обучать его на своих данных (это довольно легко), не используйте датасет общим весом больше 1Гб — об этом как-то раньше @yuri_baburov упоминал
источник

YB

Yuri Baburov in Natural Language Processing
Не, сокращения он же не умеет расшифровывать...
источник

SZ

Sergey Zhuravlev in Natural Language Processing
JamSpell сейчас у меня как раз на первом месте из более менее пригодного... Вот уже даже начал готовить датасет
источник

SZ

Sergey Zhuravlev in Natural Language Processing
Но не уверен, по этому спросил)
источник

FF

Futorio Franklin in Natural Language Processing
Может как-то на более-менее простых эвристиках построить? В том плане, что сокращения обычно являются подстроки, которые используются в том же контексте, что и оригиналы сокращений.
источник

YB

Yuri Baburov in Natural Language Processing
Для сокращений пишут словари сокращений, хотя бывают конечно моменты неоднозначности.
источник

SZ

Sergey Zhuravlev in Natural Language Processing
Yuri Baburov
Для сокращений пишут словари сокращений, хотя бывают конечно моменты неоднозначности.
То есть есть варианты кроме регулярных выражений как я понял?)
источник