Телеграмм чат группы natural_language

Сборная России разгромила команду Франции в стартовом матче на чемпионате мира по хоккею. Об этом сообщает корреспондент «Ленты.ру». Встреча прошла в пятницу, 4 мая, и завершилась со счетом 7:0. Заброшенными шайбами отметились Кирилл Капризов (8-я и 38-я минуты), Павел Бучневич (9-я), Евгений Дадонов (11-я), Александр Барабанов (43-я), Максим Шалунов (45-я) и Артем Анисимов (59-я). 29-я апреля сборная России прервала серию из пяти поражений, которая началась после ухода с поста главного тренера Олега Знарка. Команда переиграла Чехию со счетом 4:2. Для Ильи Воробьева, сменившего Знарка, эта победа стала первой во главе сборной страны. Турнир пройдет в Дании с 4 по 20 мая. Действующим чемпионом мира является сборная Швеции. Россия в последний раз завоевывала золотые медали в 2014 году, на прошлом первенстве команда заняла третье место.

Результат Natasha -
5 из 14

России, Франции,
Ленты.ру,
Кирилл Капризов,
Павел Бучневич

Может я как-то не так запустил чего?

Реальность -

России,
Франции,
Швеции,
Дании,
Чехию
Ленты.ру
Кирилл Капризов
Павел Бучневич
Евгений Дадонов
Александр Барабанов
Максим Шалунов
Артем Анисимов
Олега Знарка
Ильи Воробьева

DeepPavlov все нашел.

Николай, система Sapremo от Мегапьютера извлекает приведенного Вами фрагмента текста 14 сущностей (не считая еще 4-х дат). Можете провести свой эксперимент с этим или другими текстами, зайдя на https://sapremo.megaputer.ru/ Модуль предоставляет АПИ для интеграции во внешние системы. Можно скачать оценочную копию системы оттуда же.

sapremo.megaputer.ru

Megaputer Text Mining

Megaputer Intelligence text mining capabilities demonstration web-site.

источник

23:36пожаловаться #4

SA

Sergei Ananyan in Natural Language Processing

Николай Карпенко

Natasha и DeepPavlov явно превосходят ваш NER.

Николай, вот результаты Sapremo на этом фрагменте.

источник

23:39пожаловаться #5

SA

Sergei Ananyan in Natural Language Processing

Это наша система (производитель - Мегапьютер). Может Вам еще раз попробовать провести сравнительный анализ. Будем рады получить обратную связь.

источник

23:41пожаловаться #6

НК

Николай Карпенко... in Natural Language Processing

источник

23:43пожаловаться #7

SK

Sasha Korovii in Natural Language Processing

Sergei Ananyan

Это наша система (производитель - Мегапьютер). Может Вам еще раз попробовать провести сравнительный анализ. Будем рады получить обратную связь.

А как ви привязали сущность к странице Википедии?

источник

23:44пожаловаться #8

НК

Николай Карпенко... in Natural Language Processing

Этот пример явно показывает недостатки системы. DeepPavlov не ошибся, а Natasha сделала лишь 1 неправильный.

источник

23:45пожаловаться #9

НК

Николай Карпенко... in Natural Language Processing

Полагаю вы обучались больше на новостном датасете.

источник

23:46пожаловаться #10

НК

Николай Карпенко... in Natural Language Processing

источник

23:51пожаловаться #11

НК

Николай Карпенко... in Natural Language Processing

Мегапьютер не увидел вообще, Natasha не увидела Бантингу. Диппавлов все увидел.

источник

23:51пожаловаться #12

SA

Sergei Ananyan in Natural Language Processing

Николай Карпенко

Полагаю вы обучались больше на новостном датасете.

Николай, Мегапьютер - один из пионеров технологий анализа текста (с 2000-х годов поставляем системы клиентам). У нас реализованы две альтернативные (ну или взаимодополняющие) технологии для извлечения сущностей. Результаты, которые Вы видите в демке получены с помощью системы, работающей на лингвистических правилах. Ее преимущество в более высокой (на два порядка) скорости работы. Для промышленных применений системы высокая скорость анализа может оказаться критически важным преимуществом. Другой подход, реализованный в нашей основной системе PolyAnalyst (в дополнение к системе на правилах) основан на машинном обучении (BERT, RNN, etc.). Он как раз обучается на разных корпусах и дает результаты более-менее похожие на Deep Pavlov. Но все зависит от текстов. На разных текстах у Вас то одни, то другие системы будут давать лучшие результаты. Еще, Вам может будет интересно сравнить, как система сможет распознавать ко-референции, выходящие далеко за рамки одного предложения. Для этого сравнивать надо на больших текстах.

источник

23:57пожаловаться #13

2020 December 04

НК

Николай Карпенко... in Natural Language Processing

источник

00:02пожаловаться #14

НК

Николай Карпенко... in Natural Language Processing

Завалил диппавлова) Все ответили, а он не знает локацию

источник

00:03пожаловаться #15

OR

Oleg Ruban in Natural Language Processing

Мне кажется, что в современном мире больше внимания стоит уделять не просто извлечению NER, а работы с тем, кто текст будет читать. Недавно наткнулся на хороший пример такой реализации: https://turbocheck.ru/, есть проверки, сродные Мегапьютеру, но нечто новое всё же на рынке.

источник

00:04пожаловаться #16

НК

Николай Карпенко... in Natural Language Processing

Sergei Ananyan

Николай, Мегапьютер - один из пионеров технологий анализа текста (с 2000-х годов поставляем системы клиентам). У нас реализованы две альтернативные (ну или взаимодополняющие) технологии для извлечения сущностей. Результаты, которые Вы видите в демке получены с помощью системы, работающей на лингвистических правилах. Ее преимущество в более высокой (на два порядка) скорости работы. Для промышленных применений системы высокая скорость анализа может оказаться критически важным преимуществом. Другой подход, реализованный в нашей основной системе PolyAnalyst (в дополнение к системе на правилах) основан на машинном обучении (BERT, RNN, etc.). Он как раз обучается на разных корпусах и дает результаты более-менее похожие на Deep Pavlov. Но все зависит от текстов. На разных текстах у Вас то одни, то другие системы будут давать лучшие результаты. Еще, Вам может будет интересно сравнить, как система сможет распознавать ко-референции, выходящие далеко за рамки одного предложения. Для этого сравнивать надо на больших текстах.

Почитал, много интересного у вас уже реализовано

источник

00:04пожаловаться #17

НК

Николай Карпенко... in Natural Language Processing

Какая тарификация у вас?)

источник

00:05пожаловаться #18

KK

Konstantin K in Natural Language Processing