Size: a a a

Natural Language Processing

2021 July 08

SS

Sergey Shulga in Natural Language Processing
Слушайте, никому не попадалась большая энциклопедия медицины, но в txt форматах? А то я пока вижу только djvu и ужасные pdf, а нужен текст, хотел сделать медицинский опечаточник поверх OCR, пайп есть, но нужен частотный словарь в домене.
источник

GF

Grigory Frantsuzov in Natural Language Processing
скорее всего с флибусты вы сможете выгрузить достаточно
источник

SS

Sergey Shulga in Natural Language Processing
О, вариант, спасибо!
источник
2021 July 09

A

Alexander in Natural Language Processing
/me
источник

D

Dmitriy in Natural Language Processing
❓ Ребят доброго дня !
подскажите что попробовать табличного извлечения данных
выписка из домовой книги
источник
2021 July 10

СИ

Сергей Ильин... in Natural Language Processing
Слушайте, Яндекс.Толокой кто-то пользовался?

Вопрос такой: Можно ли взять условно картинку каких то деятелей (напр., политических) и попросить людей на яндексе сказать ассоциации/отношнние(негативное, позиьивное нейьральное)?
источник

IG

Ilya Gusev in Natural Language Processing
В целом-то можно, но я не очень понимаю, как в такой задаче качество контролировать. Что помешает толокеру везде ставить одну и ту же метку? Или просто выбирать за полсекунды случайную, даже не задумываясь.
источник

СИ

Сергей Ильин... in Natural Language Processing
Ну, тут один вопрос можно (и нужно) не одному человеку задавать
источник

IG

Ilya Gusev in Natural Language Processing
Это само собой, никто и не говорит о единичном перекрытии. Но условно 90% ответов будут просто-напросто недостоверными, и с ходу я не могу придумать механизма разделения добросовестных и недобросовестных исполнителей для этой задачи. Разве что сделать набор "однозначных" политических деятелей, но не уверен, что такие есть.
источник

VM

Victor Maslov in Natural Language Processing
подозреваю, что это против правил
источник

d

dePuff in Natural Language Processing
А просто сравнить количество результатов по запросам: Васяндр редиска \ Васяндр красава?
источник

VM

Victor Maslov in Natural Language Processing
к чему вообще такая цель? чтоб преумножать пропаганду?
источник

Д

Датасаенсяш... in Natural Language Processing
Ну кстати зря ты так, это звучит как неплохая альтернатива всяким вциомам)
источник

Д

Датасаенсяш... in Natural Language Processing
В целом толокеры обычно отвечают на вопрос честно. Я делал задания без валидации, все было ок
источник

d

dePuff in Natural Language Processing
Толокеры - выборка то, что нужно )
Например, предскажите их ответ на вопрос о месячном доходе
источник

A

Andrey in Natural Language Processing
иллюстрация))
источник

СИ

Сергей Ильин... in Natural Language Processing
Вообще не о том.
источник

СИ

Сергей Ильин... in Natural Language Processing
Ок, спасибо.
источник

SD

Sergey Dulikov in Natural Language Processing
Очень странная у вас выборка. По нашему опыту процентов 75 там читеры, которые либо сами прокликивают случайным образом, либо вообще боты.
источник

G

Gernar in Natural Language Processing
Если ставить хорошие фильтры и валидацию, то разметка получается неплохая
источник