Size: a a a

Natural Language Processing

2018 March 14

AA

Ali Abdullaev in Natural Language Processing
Круть
источник

D

Dmitry in Natural Language Processing
и классификацию по типам отзывов тоже делал.
источник

AA

Ali Abdullaev in Natural Language Processing
Тоже с ручной разметкой? Есть просто такие штуки как guidedlda, эдакое semi-supervised learning
источник

AA

Ali Abdullaev in Natural Language Processing
Где указываешь ключевые слова в каждой теме и дальше оно учитывает это при размещении тем по термам и отзывов по темам
источник

AA

Ali Abdullaev in Natural Language Processing
Мб кто как-то по другому проходил к этой задаче без размещения данных несколько дней
источник

M

Marat in Natural Language Processing
Всем привет! Я разработчик из проекта iPavlov, мы сейчас пишем опенс-сорсный NER на нейросетях + открытый датасет.

Сейчас размечаем только адреса. У меня вопрос к пользователям распознавателей адресов. Что вы называете адресом? Например, "я хожу в школу на Кантемировской" имеет ли адрес? Например, "Я живу в Москве" — адрес?

У нас сейчас рабочая гипотеза размечать всё, что имеет название улицы, не важно есть там номер дома или нет. В примере про школу мы пометим "на Кантемировской".

Конкурирующая гипотеза: адресом является только адрес, на который можно доставить письмо. Поэтому в примере про школу нет адреса.

Пожалуйста, скажите ваши мнения и желания)
источник

DV

Dima Veselov in Natural Language Processing
Москва - это локация, не адрес. Кантемировская - адрес.
Есть более интересный пример: такси до [метро пл. Александра Невского] - это локация или адрес?
источник

M

Marat in Natural Language Processing
Dima Veselov
Москва - это локация, не адрес. Кантемировская - адрес.
Есть более интересный пример: такси до [метро пл. Александра Невского] - это локация или адрес?
Локация вообще нужна кому-то? Можете случаи использования сказать?
источник

AK

Alexander Kukushkin in Natural Language Processing
Сейчас в Наташином addressextractor адресом считает улица + дом . Можно например исходить из того какие адреса пишут на сайта в разделе контакты https://github.com/natasha/natasha/issues/9#issuecomment-276799414
источник

DV

Dima Veselov in Natural Language Processing
Я как-то разбирал объявления о аренде квартир, было гораздо удобнее различать адрес и локацию, чтобы выделять к какому городу относится объявление, например: сдаю уютную двушку в москве, есть всё необходимое, северный проспект, рядом с домом остановка
источник

DV

Dima Veselov in Natural Language Processing
Может быть, это решается как-то по другому.
источник

M

Marat in Natural Language Processing
Можно предложить такую схему, наш NER выделяет адрес в какой-угодно форме, а дальше Наташа может выделить уже номера домой, названия улиц и пр. Тогда можно писать более расслабленные правила для Наташи
источник

AK

Alexander Kukushkin in Natural Language Processing
Да
источник

AK

Alexander Kukushkin in Natural Language Processing
Мне кажется это хорошая идея
источник

AZ

Alexandr Zamaraev in Natural Language Processing
У меня текущий проект - выделяем адреса доставки. Улицы там может не быть.
источник

AZ

Alexandr Zamaraev in Natural Language Processing
А вот станция метро - частенько.
источник

AZ

Alexandr Zamaraev in Natural Language Processing
Кроме того встречаются что-то типа "пос. Барабиха Самольской области"
источник

M

Marat in Natural Language Processing
Alexandr Zamaraev
У меня текущий проект - выделяем адреса доставки. Улицы там может не быть.
вы можете поделиться частью датасета без улиц? мы бы могли добавить в датасет
источник

M

Marat in Natural Language Processing
Alexandr Zamaraev
Кроме того встречаются что-то типа "пос. Барабиха Самольской области"
а как доставить в посёлок? без ничего
источник

AZ

Alexandr Zamaraev in Natural Language Processing
Х. его З. Может там всем посёлком эту доставку будут встречать на въезде. :)
источник