Size: a a a

Natural Language Processing

2020 November 26

БД

Борис Добров... in Natural Language Processing
Это без опечаток, с опечатками веселее.
Это не опен сорс и не наука, это инженерное решение с фиксацией предположение в ТЗ и оплатой работ.
источник

БД

Борис Добров... in Natural Language Processing
Обрабатываешь 20 миллионов документов, потом пополняешь словарь , если надо.
источник

НК

Николай Карпенко... in Natural Language Processing
Морфер – программа склонения по падежам
https://morpher.ru/
источник

AB

Alexey Burnakov in Natural Language Processing
Борис Добров
Это без опечаток, с опечатками веселее.
Это не опен сорс и не наука, это инженерное решение с фиксацией предположение в ТЗ и оплатой работ.
Я уже и сделал с об ходом самых явных косяков, я за это за получаю.
источник

AB

Alexey Burnakov in Natural Language Processing
Борис Добров
Проблема же, например,  в Си цзиньпинем и Си Цзинпином.

Не говоря уж о Путине и Вагине в начале предложения.
Это и есть опечатка, Си Дзиньпин(ь)
источник

БД

Борис Добров... in Natural Language Processing
Или настраиваешь словарь для исправления опечаток.
В любом случае нужны критерии, которые обычно % покрытия + 100% особо важных
источник

БД

Борис Добров... in Natural Language Processing
Alexey Burnakov
Это и есть опечатка, Си Дзиньпин(ь)
Это не опечатка, это два допу стимых варианта
источник

AB

Alexey Burnakov in Natural Language Processing
Борис Добров
Это не опечатка, это два допу стимых варианта
В смысле? Где там две э?
источник

AB

Alexey Burnakov in Natural Language Processing
Борис Добров
Это не опечатка, это два допу стимых варианта
Задача находить такие случаи в рамках текст
источник

БД

Борис Добров... in Natural Language Processing
В смысле в нормальных СМИ встречаются оба
источник

AB

Alexey Burnakov in Natural Language Processing
Борис Добров
В смысле в нормальных СМИ встречаются оба
Что такое нормальные СМИ? Я не понял аллюзии и связи с задачей
источник

AB

Alexey Burnakov in Natural Language Processing
Я пишу, что в рамках одного текста такое надо искать. Какие вопросы к этой постановке нашей задачи?
источник

БД

Борис Добров... in Natural Language Processing
Нормальные СМИ, например,  агрегируемые я.новостями.
источник

AB

Alexey Burnakov in Natural Language Processing
Борис Добров
Нормальные СМИ, например,  агрегируемые я.новостями.
ТАСС агрегируется. Дальше что?
источник

БД

Борис Добров... in Natural Language Processing
Alexey Burnakov
Я пишу, что в рамках одного текста такое надо искать. Какие вопросы к этой постановке нашей задачи?
А в соседнем будет другой вариант?
источник

БД

Борис Добров... in Natural Language Processing
Alexey Burnakov
ТАСС агрегируется. Дальше что?
Это что - троллинг?
ТАСС нормальный источник
источник

AB

Alexey Burnakov in Natural Language Processing
Борис Добров
А в соседнем будет другой вариант?
Ну как скажете, я не понял смысла технического в вопросе
источник

AB

Alexey Burnakov in Natural Language Processing
Борис Добров
Это что - троллинг?
ТАСС нормальный источник
При чем здесь вообще ТАСС
источник

AB

Alexey Burnakov in Natural Language Processing
Задача находить опечатки. Вы почитали issue на github или просто чтобы написать?
источник

БД

Борис Добров... in Natural Language Processing
Вы слушаете только себя..

Продолжайте...
источник