Слушайте, никому не попадалась большая энциклопедия медицины, но в txt форматах? А то я пока вижу только djvu и ужасные pdf, а нужен текст, хотел сделать медицинский опечаточник поверх OCR, пайп есть, но нужен частотный словарь в домене.
Вопрос такой: Можно ли взять условно картинку каких то деятелей (напр., политических) и попросить людей на яндексе сказать ассоциации/отношнние(негативное, позиьивное нейьральное)?
В целом-то можно, но я не очень понимаю, как в такой задаче качество контролировать. Что помешает толокеру везде ставить одну и ту же метку? Или просто выбирать за полсекунды случайную, даже не задумываясь.
Это само собой, никто и не говорит о единичном перекрытии. Но условно 90% ответов будут просто-напросто недостоверными, и с ходу я не могу придумать механизма разделения добросовестных и недобросовестных исполнителей для этой задачи. Разве что сделать набор "однозначных" политических деятелей, но не уверен, что такие есть.