Size: a a a

Natural Language Processing

2021 August 05

FF

Futorio Franklin in Natural Language Processing
Нужно классифицировать теги или они выступают как дополнительная информация?
источник

IS

Ivan Stankov in Natural Language Processing
Нужно классифицировать комментарии по тегам. Т.е. для новых комментариев определять теги «вкусная еда» «хороший сервис» и тд и тп
источник

IS

Ivan Stankov in Natural Language Processing
Спасибо!
источник

E

Elena in Natural Language Processing
если тегов не очень много, например, в пределах 50, то multilabel classification хорошо подойдет
источник

IS

Ivan Stankov in Natural Language Processing
Окей. Спасибо)
источник

OS

Oleg Serikov in Natural Language Processing
Привет! А откуда вы достаёте синонимы для английского?
источник

AZ

Andrey Zakharov in Natural Language Processing
из wordnet
источник

OS

Oleg Serikov in Natural Language Processing
Спасибо)
источник

🐙

🐙 in Natural Language Processing
Привет! Вникаю в известные подходы к экстрактивной саммеризации, во многих пейперах основной бейзлайн (как и очевидно следует из задачи) - выбрать наиболее релевантные предложения, и просто их оставить. Никому не попадались работы по сокращению текста путём "убирания" малоинформативных слов, какого-нибудь перетряхивания дерева зависимостей, или это немного другая задача?
источник

VP

Vladimir P in Natural Language Processing
Я вот нашел подход абстрактной компрессии с помощью автоэнкодеров https://arxiv.org/pdf/1904.03651.pdf
источник

🐙

🐙 in Natural Language Processing
Ага, про абстрактивную много подходов есть, даже, насколько помню, выше в чате было предложение при абстрактивной генерации ограничивать возможные токены входным набором, что, в целом, может дать тот эффект, который я ищу 🤔
источник

A

Andrei in Natural Language Processing
а с чем связано ограничение на сколько-то тегов? любопытно
источник

E

Elena in Natural Language Processing
Чем больше тегов, тем сложнее добиться точности от модели
источник

SancheZz Мов in Natural Language Processing
Зависит от мощности
источник

SancheZz Мов in Natural Language Processing
Ширины и глубины сети
источник

SancheZz Мов in Natural Language Processing
И тп
источник

SancheZz Мов in Natural Language Processing
Это не мешает же языковым моделям на словаре в десятки тыс слов предсказать лейбел
источник

SancheZz Мов in Natural Language Processing
Но ответ в их мощности, скок весов и тп
источник

E

Elena in Natural Language Processing
Если лейбл один, конечно, не мешает. А если лейблов много, то задача усложняется
источник

SancheZz Мов in Natural Language Processing
Но там распределение тоже размывается на дестяки тыс вариантов
источник