Size: a a a

Natural Language Processing

2021 August 07

SS

Sergey Shulga in Natural Language Processing
А зачем первая часть в условии? Ведь придти может строка, которой не было в предыдущем запросе, и так в основном и будет.
источник

🐙

🐙 in Natural Language Processing
Это на ваше усмотрение проверить, что то, что присылает юзер - не новое стихотворение, а что-то из ранее найденных кандидатов. Можно накапливать пул присланных строк для простоты. И очищать, когда стихотворение найдено, либо по сигналу пользователя "ок, теперь шлю другое"
источник

М

Майя in Natural Language Processing
Всем привет, а кто чем пользовался для relation extraction?
Есть размеченные данные и неплохо работающий NER, хотелось бы группировать извлеченные сущности, пока обходилась правилами, но на них находятся исключения. Мне тут когда-то рекомендовали Spert, может, еще какие-то варианты есть?
источник

VF

Vadim Fomin in Natural Language Processing
источник

B

Banof in Natural Language Processing
🔫 @EmilPorter кикнут — вернуть этого пользователя можно только разбаном в настройках чата.

Проголосовавшие за кик:
@wadimiusz, @stbarkhatov, @Alexworteg, @tixons, @i_wanna_be_adored
При поддержке Золота Бородача
источник

GV

Gio Vani in Natural Language Processing
Приветы!
Хочу учить НЛП на рабочей задаче. Надо определять пол автора по коротким сообщениям. Размеченных данных для обучения нет. Есть только, на чем потестировать.

Читал статью с "Диалога"
Там предлагали использовать несколько вариантов обучения, но обучать модель не на чем. Куда копать?
источник

SancheZz Мов in Natural Language Processing
Брать пайморфи например
источник

SancheZz Мов in Natural Language Processing
И размечать токены по лицу и роду
источник

SancheZz Мов in Natural Language Processing
Далее уже на основе этого сделать свою разметку
источник

N

Natalia in Natural Language Processing
крайне отстойная задача для 2021 :((

и по-хорошему надо тренировать _как_минимум_ на 3 классах, где один — "невозможно определить", причём данные размечать не по дополнительно имеющимся метаданным, а желательно бы с человеческой ручной оценкой
источник

SancheZz Мов in Natural Language Processing
Мы кстати так делаем в проме
источник

SancheZz Мов in Natural Language Processing
Но там есть ресурсы
источник

SancheZz Мов in Natural Language Processing
@gio_vani как у вас с ресурсами?
источник

N

Natalia in Natural Language Processing
с ручной и этим спец. классом?
источник

SancheZz Мов in Natural Language Processing
Угу
источник

N

Natalia in Natural Language Processing
сорри, если что, я правда пишу, как вижу приближение данных к реальности
источник

N

Natalia in Natural Language Processing
здорово тогда!
источник

FF

Futorio Franklin in Natural Language Processing
Можно грамматическим парсингом подтягивать местоимения
источник

SancheZz Мов in Natural Language Processing
Мы тоже начали с начала с пайморфи/ рнн морф
источник

SancheZz Мов in Natural Language Processing
Потом разметку на правилах с этим ещё загнали людям
источник