Всем привет! Я разработчик из проекта iPavlov, мы сейчас пишем опенс-сорсный NER на нейросетях + открытый датасет.
Сейчас размечаем только адреса. У меня вопрос к пользователям распознавателей адресов. Что вы называете адресом? Например, "я хожу в школу на Кантемировской" имеет ли адрес? Например, "Я живу в Москве" — адрес?
У нас сейчас рабочая гипотеза размечать всё, что имеет название улицы, не важно есть там номер дома или нет. В примере про школу мы пометим "на Кантемировской".
Конкурирующая гипотеза: адресом является только адрес, на который можно доставить письмо. Поэтому в примере про школу нет адреса.
Пожалуйста, скажите ваши мнения и желания)