хотя описано всё очень "вкусно", вот что-то такое и ищу - тут оно даже назад в контексте исходной статьи может возвращаться и брать оттуда части порождаемого предложения
Пара вопросов: Чем лучше определять пол по ФИО? Чем лучше определять - слово (набор слов через пробел для сложносочинённых именований) это Ф или И или О? Нужно для сортировки ФИО в случае когда оно задано одной строкой.
Кто-нибудь сталкивался с задачей автоматического реферирования (automatic summarization)? Есть ли готовые решения, которые не просто берут целиком подряд идущие предложения?
Библиотека имеет реализуцию 8 алгоритмов сумаризации Module for automatic summarization of text documents and HTML pages. https://pypi.python.org/pypi/sumy
Библиотека имеет реализуцию 8 алгоритмов сумаризации Module for automatic summarization of text documents and HTML pages. https://pypi.python.org/pypi/sumy
Да, не срочно, конечно. 😉 Спасибо что откликнулись.
Ооо. Вот что я узнал. Как было дело Был какой-то объем кода с pymorphy На питоне естественно И было решено заиспользовать его с эластиком Иии... был написан плагин для эластика, который на каждый вопрос по сокету лезет к запущенному python-процессу и просит его разобрать фразу
тут сразу несколько косяков может быть: в аноконде, и в том, что всё это дело инсталлится из под винды, а на сколько я помню (могу ошибаться) DAWG что-то из C кода должен скомпилить
Ага, если деталнее рассмотреть стектрейс, понятно, что вылетает на попытке распарсить ответ какой-то утилиты. А она отдаёт свой stdout в чём-то отличном от utf-8. Попробуй переключить консоль в utf-8 - chcp 65001