Size: a a a

Natural Language Processing

2021 January 27

A

Anton in Natural Language Processing
Вроде бы так
источник

PL

Pavel Lebedev in Natural Language Processing
Roman Samarev
Dbpedia, wikidata?
скорее что-то такое нужно: https://rusvectores.org/ru/associates/ (если запустить форму с главной страницы, https://rusvectores.org/ru/, то там еще визуализация есть). только хотелось бы больше слов, он оставляет только 10, и не очень понятен точный состав корпуса, может есть еще какие-то альтернативы.
источник

A

Anton in Natural Language Processing
Проходим по матчингу, там есть токены, а далее из токена надо взять token.value
источник

A

Anton in Natural Language Processing
Функция display не нужна, это для визуализации
источник

AB

Aljona Barbanova in Natural Language Processing
Anton
Проходим по матчингу, там есть токены, а далее из токена надо взять token.value
Спасибо
источник

V

Viacheslav in Natural Language Processing
Pavel Lebedev
добрый! подскажите, есть ли открытые базы с семантическими полями понятий русского языка? условно, у меня есть термин «игра» мне надо посмотреть поле ассоциирущихся с ним у людей/в каком-то корпусе слов и, возможно, какую-то их кластеризацию/классификацию.
Wikidata, на хабре была статья как это извлекать.
источник

PL

Pavel Lebedev in Natural Language Processing
спасибо
источник

RS

Roman Samarev in Natural Language Processing
Viacheslav
Wikidata, на хабре была статья как это извлекать.
источник

В

Ветров in Natural Language Processing
David Dale
Для русского языка есть тезаурус ruwordnet (пример: дуб), выкачанная копия его второй версии есть в папке прошлогоднего соревнования по обогащению таксономий (ruwordnet.zip) и в моём репозитории python-ruwordnet. Там есть, в частности, отношения "is a" и "composed of" между понятиями (aka синсетами).
Давид, спасибо!
источник

В

Ветров in Natural Language Processing
David Dale
Для русского языка есть тезаурус ruwordnet (пример: дуб), выкачанная копия его второй версии есть в папке прошлогоднего соревнования по обогащению таксономий (ruwordnet.zip) и в моём репозитории python-ruwordnet. Там есть, в частности, отношения "is a" и "composed of" между понятиями (aka синсетами).
Давид, спасибо! Но как эти xml документы открыть в C#, если я не знаю структуру классов и Базы Знаний? Может пришлете фрагмент программы, или хотя бы описание структуры классов? Спасибо!
источник

AO

Alex Orgish in Natural Language Processing
Ветров
Давид, спасибо! Но как эти xml документы открыть в C#, если я не знаю структуру классов и Базы Знаний? Может пришлете фрагмент программы, или хотя бы описание структуры классов? Спасибо!
источник
2021 January 28

ВГ

Вадим Гилемзянов... in Natural Language Processing
Ребят, привет - есть следующая задача. Как перевести обращение к человеку по роду - к примеру: "Ты пришла домой и на столе лежала ложка" - к мужскому - "Ты пришел домой и на столе лежала ложка"
источник

GF

Grigory Frantsuzov in Natural Language Processing
Вадим Гилемзянов
Ребят, привет - есть следующая задача. Как перевести обращение к человеку по роду - к примеру: "Ты пришла домой и на столе лежала ложка" - к мужскому - "Ты пришел домой и на столе лежала ложка"
Кажется можно с помощью pymorphy2 сделать
источник

GF

Grigory Frantsuzov in Natural Language Processing
источник

YB

Yuri Baburov in Natural Language Processing
Вадим Гилемзянов
Ребят, привет - есть следующая задача. Как перевести обращение к человеку по роду - к примеру: "Ты пришла домой и на столе лежала ложка" - к мужскому - "Ты пришел домой и на столе лежала ложка"
вот посмотрите здесь https://colab.research.google.com/drive/1EY0eL8Dfj7EuvUyR0fhJ4OyutwW4IZhT?usp=sharing функцию
norm_chunk , она переводит фразу в именительный падеж.
там используется комбинация spacy + pymorphy для повышения качества работы по сравнению с просто pymorphy .
но, если у вас несколько noun_chunks в предложении, то нужно понимать, какой сегмент вам нужно исправлять.
для этого вам нужен синтаксический анализ (который там как раз и делается), а после него — как-то понять, какой именно сегмент нужно исправлять. вот эту логику поиска сегмента написать нужно будет вам (искать клаузу со словом "ты", потом взять глагол-родитель?).
источник

AZ

Alexandra Zh in Natural Language Processing
коллеги, всем привет

а подскажите, пожалуйста — есть ли какие-то модели/корпусы для тональности, кроме мокорона, которые отслеживают не только хейтспич, но и просто негативные эмоции?
источник

AZ

Alexandra Zh in Natural Language Processing
или что-то с градацией негатива связанное
источник

AZ

Alexandra Zh in Natural Language Processing
конечно, всегда остается вариант с ручной разметкой, но вдруг уже есть что-то (гугление результатов не дало)
источник

YB

Yuri Baburov in Natural Language Processing
Alexandra Zh
коллеги, всем привет

а подскажите, пожалуйста — есть ли какие-то модели/корпусы для тональности, кроме мокорона, которые отслеживают не только хейтспич, но и просто негативные эмоции?
rusentiment / dostoevsky ? правда там на практике весьма неточные результаты, как мне показалось, но это может только для моей задачи так было.
источник

AZ

Alexandra Zh in Natural Language Processing
Yuri Baburov
rusentiment / dostoevsky ? правда там на практике весьма неточные результаты, как мне показалось, но это может только для моей задачи так было.
везде примерно одинаково было(
источник