Подскажите пожалуйста, пишу rules по работе с адресами на украиском языке, рулы странным образом вообще не работают, подскажите пожалуйста, куда тут можно копать чтобы разобраться?
Товарищи у кого то было что pymorphy2 не видит на коллабе свои словари?
Все ругаются. Поломалось. Надо бы опять найти Мишу Коробова, автора pymorphy, что появился, выкатил апдейт, который ломается, и пока что не отвечает на issue. А лучше -- если кто-нибудь разберётся и пришлет патч. https://github.com/kmike/pymorphy2/issues/131
Подскажите какой инструмент используется для того, чтобы расшифровывать сокращения в тексте? Я правильно понимаю, что это не в сторону спел чекера надо смотреть? Или готового инструмента нет и надо с нуля свой писать?
Подскажите какой инструмент используется для того, чтобы расшифровывать сокращения в тексте? Я правильно понимаю, что это не в сторону спел чекера надо смотреть? Или готового инструмента нет и надо с нуля свой писать?
Главное если будете обучать его на своих данных (это довольно легко), не используйте датасет общим весом больше 1Гб — об этом как-то раньше @yuri_baburov упоминал
Может как-то на более-менее простых эвристиках построить? В том плане, что сокращения обычно являются подстроки, которые используются в том же контексте, что и оригиналы сокращений.