Size: a a a

Natural Language Processing

2020 December 03

МП

Михаил Притугин... in Natural Language Processing
Самое быстрое решение - это парсер от Яндекса, если запускать многопоточно
источник

МП

Михаил Притугин... in Natural Language Processing
Но работает фигово
источник

МП

Михаил Притугин... in Natural Language Processing
Если задача состоит в точном нахождении, то не пойдет
Если поиск на больших данных, где часто попадаются одинаковые персоны/организации и тд
То можно постобработкой улучшить качество до приемлемого
источник

МП

Михаил Притугин... in Natural Language Processing
То есть если 20 раз встретилась персона/организация - валидно
Если 1 раз - то ошибка
источник

МП

Михаил Притугин... in Natural Language Processing
Буду рад критике и предложениям)
источник

НК

Николай Карпенко... in Natural Language Processing
Пожалуй, здесь тот самый случай для rule-based
источник

НК

Николай Карпенко... in Natural Language Processing
Я тоже тестировал разные NER и результат печальный.
источник

НК

Николай Карпенко... in Natural Language Processing
Диппавлов на gpu оказался всего раз в 5 быстрее чем на i7
источник

МП

Михаил Притугин... in Natural Language Processing
На хороших данных всё окей
Но на боевых получается медленно и не оч(
источник

МП

Михаил Притугин... in Natural Language Processing
Николай Карпенко
Пожалуй, здесь тот самый случай для rule-based
Смотря какие данные и правила
источник

НК

Николай Карпенко... in Natural Language Processing
В любом случае то что выдает NER надо еще скриптами чистить
источник

МП

Михаил Притугин... in Natural Language Processing
Лучшее решение, что я оставил
Это Берт от диппавлова, а потом NamesExtractor из Наташи
источник

МП

Михаил Притугин... in Natural Language Processing
Плюс постобработка
источник

НК

Николай Карпенко... in Natural Language Processing
Ты не создавал свою диппавлова NER модель?
источник

МП

Михаил Притугин... in Natural Language Processing
Неа, предобученную юзаю их
источник

МП

Михаил Притугин... in Natural Language Processing
Мне больше важна полнота в задаче
источник

МП

Михаил Притугин... in Natural Language Processing
Чем качество
источник

МП

Михаил Притугин... in Natural Language Processing
Диппавлов с этим справляется
источник

НК

Николай Карпенко... in Natural Language Processing
а в чем отличие полноты и качества?
источник

МП

Михаил Притугин... in Natural Language Processing
Качество - процент валидных из распознанных
Полнота - процент найденных из всех
источник