Телеграмм чат группы natural_language_processing страница 928

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Natural Language Processing

2220 membersпожаловаться на группу

2020 November 26

AB

Alexey Burnakov in Natural Language Processing

Alexey Burnakov

@alexkuk , автор Natasha Отказался общаться со мной, после обсуждения ошибок в работе библиотеки. Было заведено issue на githab проекта: https://github.com/natasha/natasha/issues/93 Проблема состоит в том, что библиотека создает весьма значительно количество неправильных normal форм ФИО, о чем было подробно рассказано Автору с приложением текстов, где эта проблема встречается. На нашем корпусе текстов мы ее видим довольно часто. А учитывая, что именно нормальные формы у нас используются для анализа, мы ищем опечатки в ФИО (отличается один символ). В итоге, в корпусе текстов, где присутствуют как минимум два одних и тех же ФИО, и их нормализованные формы отличаются на 1 символ, ложно-положительных срабатываний более 99%. Это те случаи, когда опечатки не было, а была неправильная нормализованная форма. Эти 99% процентов, конечно, не являются универсальной метрикой качества Natsha NER normal. Как указано в issue в ходе тестирования мы выявили, что если в тексте есть как минимум два раза встречается ФИО, и есть отличие на 1 символ, то 99% и более - это ошибка библиотеки. В связи в этим, а также тем фактом, что Автор были выслано для анализа 3200 текстов, содержащих 5631 ошибку - в качестве базы для анализа этого бага (несовершества), весьма странно выглядит то, что он отказался обсуждать решение, сославшись на несовершенство компонентов.

NER for persons produces over 99% mistaken forms under specific conditions · Issue #93 · natasha/natasha

Consider a use case, where we need to detect typos in person names that appear in news texts. Example of true positive: " Второй его лентой была криминальная драма "Проклятый путь...

источник

17:44пожаловаться #1

AB

Alexey Burnakov in Natural Language Processing

Alexey Burnakov

@alexkuk , автор Natasha Отказался общаться со мной, после обсуждения ошибок в работе библиотеки. Было заведено issue на githab проекта: https://github.com/natasha/natasha/issues/93 Проблема состоит в том, что библиотека создает весьма значительно количество неправильных normal форм ФИО, о чем было подробно рассказано Автору с приложением текстов, где эта проблема встречается. На нашем корпусе текстов мы ее видим довольно часто. А учитывая, что именно нормальные формы у нас используются для анализа, мы ищем опечатки в ФИО (отличается один символ). В итоге, в корпусе текстов, где присутствуют как минимум два одних и тех же ФИО, и их нормализованные формы отличаются на 1 символ, ложно-положительных срабатываний более 99%. Это те случаи, когда опечатки не было, а была неправильная нормализованная форма. Эти 99% процентов, конечно, не являются универсальной метрикой качества Natsha NER normal. Как указано в issue в ходе тестирования мы выявили, что если в тексте есть как минимум два раза встречается ФИО, и есть отличие на 1 символ, то 99% и более - это ошибка библиотеки. В связи в этим, а также тем фактом, что Автор были выслано для анализа 3200 текстов, содержащих 5631 ошибку - в качестве базы для анализа этого бага (несовершества), весьма странно выглядит то, что он отказался обсуждать решение, сославшись на несовершенство компонентов.

NER for persons produces over 99% mistaken forms under specific conditions · Issue #93 · natasha/natasha

Consider a use case, where we need to detect typos in person names that appear in news texts. Example of true positive: " Второй его лентой была криминальная драма "Проклятый путь...

источник

17:45пожаловаться #2

AB

Alexey Burnakov in Natural Language Processing

Alexey Burnakov

@alexkuk , автор Natasha Отказался общаться со мной, после обсуждения ошибок в работе библиотеки. Было заведено issue на githab проекта: https://github.com/natasha/natasha/issues/93 Проблема состоит в том, что библиотека создает весьма значительно количество неправильных normal форм ФИО, о чем было подробно рассказано Автору с приложением текстов, где эта проблема встречается. На нашем корпусе текстов мы ее видим довольно часто. А учитывая, что именно нормальные формы у нас используются для анализа, мы ищем опечатки в ФИО (отличается один символ). В итоге, в корпусе текстов, где присутствуют как минимум два одних и тех же ФИО, и их нормализованные формы отличаются на 1 символ, ложно-положительных срабатываний более 99%. Это те случаи, когда опечатки не было, а была неправильная нормализованная форма. Эти 99% процентов, конечно, не являются универсальной метрикой качества Natsha NER normal. Как указано в issue в ходе тестирования мы выявили, что если в тексте есть как минимум два раза встречается ФИО, и есть отличие на 1 символ, то 99% и более - это ошибка библиотеки. В связи в этим, а также тем фактом, что Автор были выслано для анализа 3200 текстов, содержащих 5631 ошибку - в качестве базы для анализа этого бага (несовершества), весьма странно выглядит то, что он отказался обсуждать решение, сославшись на несовершенство компонентов.

NER for persons produces over 99% mistaken forms under specific conditions · Issue #93 · natasha/natasha

Consider a use case, where we need to detect typos in person names that appear in news texts. Example of true positive: " Второй его лентой была криминальная драма "Проклятый путь...

Огрехи работы библиотеки, представленные для обработки, скрываются, предлагается поэкспериментировать самим пользователям или как-то иначе это может происходить?

источник

17:46пожаловаться #3

KL

Kir L in Natural Language Processing

Алексей, Вы правда немного агрессивно общаетесь на скринах.

источник

17:46пожаловаться #4

DK

Denis Kirjanov in Natural Language Processing

а почему Вы чего-то требуете от разработчика опенсорсной библиотеки? он обязан по первому вашему слову куда-то бежать?

источник

17:47пожаловаться #5

MT

Mikhail Tikhomirov in Natural Language Processing

Так это опенсорс либа, а не коммерческий продукт, который Вам продают. Странные претензии в таком случае :)

источник

17:47пожаловаться #6

A

Andrei in Natural Language Processing

ахах, вот так опенсорс разрабатывают люди, а потом прилетает

источник

17:47пожаловаться #7

AB

Alexey Burnakov in Natural Language Processing

Алексей, Вы правда немного агрессивно общаетесь на скринах.

На мои прямые вопросы я не получаю ответов, в результате просто отказ общаться

источник

17:47пожаловаться #8

AB

Alexey Burnakov in Natural Language Processing

ахах, вот так опенсорс разрабатывают люди, а потом прилетает

А что*

источник

17:47пожаловаться #9

AB

Alexey Burnakov in Natural Language Processing

?

источник

17:47пожаловаться #10

AB

Alexey Burnakov in Natural Language Processing

Давайте дам предысторию небольшую, без резкостей

источник

17:48пожаловаться #11

DK

Denis Kirjanov in Natural Language Processing

Alexey Burnakov

На мои прямые вопросы я не получаю ответов, в результате просто отказ общаться

Вы даете не упреки, а команды в духе "иди поправь немедленно, сделал ты говно"

источник

17:48пожаловаться #12

A

Andrei in Natural Language Processing

нинннадо плез)

источник

17:48пожаловаться #13

MT

Mikhail Tikhomirov in Natural Language Processing

Соглашусь, история будет лишней, на мой взгляд

источник

17:48пожаловаться #14

DK

Denis Kirjanov in Natural Language Processing

окей, сделайте "говно" не сами -- киньте пару PR для улучшения работы с фамилиями, делов-то

источник

17:48пожаловаться #15

A

Andrei in Natural Language Processing

ваще переписку выкладывать ну такое

источник

17:48пожаловаться #16

A

Andrei in Natural Language Processing

можете форк сделать

источник

17:48пожаловаться #17

AB

Alexey Burnakov in Natural Language Processing

окей, сделайте "говно" не сами -- киньте пару PR для улучшения работы с фамилиями, делов-то

Я может и могу, но мне просто говорят, вы язвите, я не буду общаться

источник

17:49пожаловаться #18

AB

Alexey Burnakov in Natural Language Processing

источник

17:49пожаловаться #19

AB

Alexey Burnakov in Natural Language Processing

Alexey Burnakov

Автор собирал фидбек. Он получил фидбек.

источник

17:50пожаловаться #20