Телеграмм чат группы natural_language_processing страница 16

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Natural Language Processing

1279 membersпожаловаться на группу

1
«
…
‹
11
12
13
14
15
16
17
›
…
»

2017 May 19

🕵

🕵🏻 Макс in Natural Language Processing

У них была возможность указать свой фикс-лист, как-раз для таких случаев, насколько я знаю.

Спасибо, гляну сейчас. Я просто использую обертку на Python, она не дает никаких особых настроек.

источник

10:06пожаловаться #1

🕵

🕵🏻 Макс in Natural Language Processing

pymystem3, которая

источник

10:29пожаловаться #2

|

||||| in Natural Language Processing

Привет. Для проверки длины строк есть встроенный лейбл: https://github.com/bureaucratic-labs/yargy/blob/master/yargy/labels.py#L86
Можно написать такой же, но для чисел (у них token.forms[0]['normal_form'] - текстовое представление)

bureaucratic-labs/yargy

yargy - Tiny package for information extraction

А можно ли как-то сделать два условия для токена: gram(NUM) и length_eq(4)?

источник

10:29пожаловаться #3

🕵

🕵🏻 Макс in Natural Language Processing

А в python-mystem снятие омонимии возможно тоже, да?

источник

10:34пожаловаться #4

DV

Dima Veselov in Natural Language Processing

А можно ли как-то сделать два условия для токена: gram(NUM) и length_eq(4)?

Да, нужно просто передать список лейблов в правилах, как тут: https://github.com/bureaucratic-labs/natasha/blob/master/natasha/grammars/person/grammars.py#L45
Если все лейблы проходят - токен сматчится.

bureaucratic-labs/natasha

natasha - Rule-based named entity recognition library for russian language

источник

10:35пожаловаться #5

DV

Dima Veselov in Natural Language Processing

🕵🏻 Макс

А в python-mystem снятие омонимии возможно тоже, да?

Нет, в libmystem.so от яндекса, которую использует библиотека эту фичу вырезали.

источник

10:36пожаловаться #6

DV

Dima Veselov in Natural Language Processing

Т.е. снятие морфологической неоднозначности есть только в бинарнике mystem

источник

10:36пожаловаться #7

🕵

🕵🏻 Макс in Natural Language Processing

Нет, в libmystem.so от яндекса, которую использует библиотека эту фичу вырезали.

😢

источник

10:37пожаловаться #8

🕵

🕵🏻 Макс in Natural Language Processing

Прямо беда с этим NLP, ни одного готового решения нет. Приходится какого-то франкенштейна делать.

источник

10:39пожаловаться #9

S

Shine in Natural Language Processing

обколются этими вашими nlp

источник

10:39пожаловаться #10

DV

Dima Veselov in Natural Language Processing

Готовые решения есть, просто нужно деньги занести :)
RCO, ABBYY, PullEnti, вот эти ребята.

источник

10:43пожаловаться #11

DV

Dima Veselov in Natural Language Processing

Здесь хороший список, кстати: https://nlpub.ru/%D0%9E%D0%B1%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%BA%D0%B0_%D1%82%D0%B5%D0%BA%D1%81%D1%82%D0%B0

источник

10:43пожаловаться #12

🕵

🕵🏻 Макс in Natural Language Processing

Да, этот список я уже поизучал )

источник

18:41пожаловаться #13

🕵

🕵🏻 Макс in Natural Language Processing

Еще забавный результат выдал сегодня Mystem:

{'text': 'клеют', 'analysis': [{'lex': 'клеть', 'qual': 'bastard', 'gr': 'V,сов,нп=непрош,мн,изъяв,3-л'}]}

Это ошибка орфографическая, конечно. Но что за 'qual': 'bastard'? )

источник

18:43пожаловаться #14

🕵

🕵🏻 Макс in Natural Language Processing

А, нашел в примерах. )

источник

18:46пожаловаться #15

2017 June 14

EV

Egor V. in Natural Language Processing

Привет. Наташа использует только правила или ещё и машинное обучение?

источник

10:39пожаловаться #16

DV

Dima Veselov in Natural Language Processing

Привет. Прямо сейчас - частично. Например, морфанализатор умеет предсказывать неизвестные слова (там используются статистические методы)
В дальнейшем, я хочу использовать, например, статистический токенизатор - это тоже машинное обучение.

источник

10:47пожаловаться #17

EV

Egor V. in Natural Language Processing

Пишу обзор инструментов для вкр. Решил описать её.

источник

10:48пожаловаться #18

2017 June 15

🕵

🕵🏻 Макс in Natural Language Processing

Где можно будет почитать обзор? :)

источник

19:58пожаловаться #19

2017 June 18

DB

Dmitry Bespalov in Natural Language Processing

@dveselov, привет! Выражаю всяческое уважение за проделанную работу. Скажи, пожалуйста, как бы ты рекомендовал подходить добыче именнованных сущностей с помощью Наташи в большом тестке, например, >5000 знаков?

источник

11:52пожаловаться #20

1
«
…
‹
11
12
13
14
15
16
17
›
…
»