Телеграмм чат группы natural_language_processing страница 1021

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Natural Language Processing

2396 membersпожаловаться на группу

2021 January 21

YS

Yaroslav Seliverstov in Natural Language Processing

Друзья всем привет! Может кто-нибудь подсказать библиотеки для получения отглагольных существительных на русском?

источник

10:55пожаловаться #1

AW

Alex Wortega in Natural Language Processing

Господа а что то кроме LDA/LSI есть для моделирования топиков из текста? Задача чтобы вытащить основные темы из текста для дальнейшего расположения этих текстов в презу.

Ну те каждый слайд имеет свою тему по этому необходима довольно высокая точность, при этом нельзя вытащить какие то фичи которые будут характеризовать тот или иной слайд.

источник

12:19пожаловаться #2

ni

n i in Natural Language Processing

Господа а что то кроме LDA/LSI есть для моделирования топиков из текста? Задача чтобы вытащить основные темы из текста для дальнейшего расположения этих текстов в презу.

Ну те каждый слайд имеет свою тему по этому необходима довольно высокая точность, при этом нельзя вытащить какие то фичи которые будут характеризовать тот или иной слайд.

BigARTM (https://bigartm.readthedocs.io/en/stable/)
или ABAE
https://github.com/alexeyev/abae-pytorch

alexeyev/abae-pytorch

PyTorch implementation of 'An Unsupervised Neural Attention Model for Aspect Extraction' by He et al. ACL2017' - alexeyev/abae-pytorch

источник

12:32пожаловаться #3

AW

Alex Wortega in Natural Language Processing

n i

BigARTM (https://bigartm.readthedocs.io/en/stable/)
или ABAE
https://github.com/alexeyev/abae-pytorch

alexeyev/abae-pytorch

PyTorch implementation of 'An Unsupervised Neural Attention Model for Aspect Extraction' by He et al. ACL2017' - alexeyev/abae-pytorch

О, а с русским у abae все плохо?

источник

12:34пожаловаться #4

ni

n i in Natural Language Processing

Ну это смотря какую модель эмбедингов туда положить

источник

12:34пожаловаться #5

KS

Konstantin Smith in Natural Language Processing

Yaroslav Seliverstov

Друзья всем привет! Может кто-нибудь подсказать библиотеки для получения отглагольных существительных на русском?

В SDK Pullenti есть так называемые "дериватные группы", содержащие однокоренные слова разных частей речи (ПРОИЗВОДСТВО ПРОИЗВОДИТЬ ПРОИЗВЕСТИ ПРОИЗВОДСТВЕННЫЙ ПРОИЗВОДИМЫЙ ПРОИЗВЕДЁННЫЙ и т.д.). В статическом классе Pullenti.Semantic.Utils.DerivateService есть функция FindDerivates(словоформа). Можно из одной части речи в другую, или, например, для несовершенной формы глагола получить совершенную и т.п. Группа содержит не только русские, но и украинские слова (ещё и английские, но тут качество не гарантируется). Подробности см. в документации. Сейчас в словаре около 15000 групп.

источник

13:15пожаловаться #6

KS

Konstantin Smith in Natural Language Processing

Например, если "плагиат" искать не на уровне нормализованных слов, а на уровне групп, то может искаться межязыковой плагиат.

источник

13:17пожаловаться #7

YS

Yaroslav Seliverstov in Natural Language Processing

Konstantin Smith

В SDK Pullenti есть так называемые "дериватные группы", содержащие однокоренные слова разных частей речи (ПРОИЗВОДСТВО ПРОИЗВОДИТЬ ПРОИЗВЕСТИ ПРОИЗВОДСТВЕННЫЙ ПРОИЗВОДИМЫЙ ПРОИЗВЕДЁННЫЙ и т.д.). В статическом классе Pullenti.Semantic.Utils.DerivateService есть функция FindDerivates(словоформа). Можно из одной части речи в другую, или, например, для несовершенной формы глагола получить совершенную и т.п. Группа содержит не только русские, но и украинские слова (ещё и английские, но тут качество не гарантируется). Подробности см. в документации. Сейчас в словаре около 15000 групп.

Спасибо! Не слышал даже от таком. Сегодня посмотрю.

источник

13:17пожаловаться #8

AZ

Alexandra Zh in Natural Language Processing

Konstantin Smith

В SDK Pullenti есть так называемые "дериватные группы", содержащие однокоренные слова разных частей речи (ПРОИЗВОДСТВО ПРОИЗВОДИТЬ ПРОИЗВЕСТИ ПРОИЗВОДСТВЕННЫЙ ПРОИЗВОДИМЫЙ ПРОИЗВЕДЁННЫЙ и т.д.). В статическом классе Pullenti.Semantic.Utils.DerivateService есть функция FindDerivates(словоформа). Можно из одной части речи в другую, или, например, для несовершенной формы глагола получить совершенную и т.п. Группа содержит не только русские, но и украинские слова (ещё и английские, но тут качество не гарантируется). Подробности см. в документации. Сейчас в словаре около 15000 групп.

Интересно как, спасибо

источник

13:18пожаловаться #9

YS

Yaroslav Seliverstov in Natural Language Processing

Konstantin Smith

В SDK Pullenti есть так называемые "дериватные группы", содержащие однокоренные слова разных частей речи (ПРОИЗВОДСТВО ПРОИЗВОДИТЬ ПРОИЗВЕСТИ ПРОИЗВОДСТВЕННЫЙ ПРОИЗВОДИМЫЙ ПРОИЗВЕДЁННЫЙ и т.д.). В статическом классе Pullenti.Semantic.Utils.DerivateService есть функция FindDerivates(словоформа). Можно из одной части речи в другую, или, например, для несовершенной формы глагола получить совершенную и т.п. Группа содержит не только русские, но и украинские слова (ещё и английские, но тут качество не гарантируется). Подробности см. в документации. Сейчас в словаре около 15000 групп.

А ты не знаешь , есть ли там конкретно отглагольные сущ.? Типа Разрабатывать-разработка

источник

15:06пожаловаться #10

KS

Konstantin Smith in Natural Language Processing

Yaroslav Seliverstov

А ты не знаешь , есть ли там конкретно отглагольные сущ.? Типа Разрабатывать-разработка

Есть. Группа содержит список слов с частями речи, в том числе там есть и существительные, и глаголы.

источник

15:07пожаловаться #11

YB

Yuri Baburov in Natural Language Processing

Konstantin Smith

В SDK Pullenti есть так называемые "дериватные группы", содержащие однокоренные слова разных частей речи (ПРОИЗВОДСТВО ПРОИЗВОДИТЬ ПРОИЗВЕСТИ ПРОИЗВОДСТВЕННЫЙ ПРОИЗВОДИМЫЙ ПРОИЗВЕДЁННЫЙ и т.д.). В статическом классе Pullenti.Semantic.Utils.DerivateService есть функция FindDerivates(словоформа). Можно из одной части речи в другую, или, например, для несовершенной формы глагола получить совершенную и т.п. Группа содержит не только русские, но и украинские слова (ещё и английские, но тут качество не гарантируется). Подробности см. в документации. Сейчас в словаре около 15000 групп.

Konstantin, а твоя лицензия сейчас позволяет их выложить отдельно как датасет? Не все готовы подтянуть Pullenti когда им нужна только эта функциональность...

источник

15:09пожаловаться #12

KS

Konstantin Smith in Natural Language Processing

Пока не готов

источник

15:09пожаловаться #13

YB

Yuri Baburov in Natural Language Processing

Konstantin Smith

Пока не готов

ты не готов, но лицензия позволяет? если кто-нибудь это сделает, кому это нужно, то так можно?

источник

15:10пожаловаться #14

AS

Alex Surname in Natural Language Processing

Konstantin Smith

В SDK Pullenti есть так называемые "дериватные группы", содержащие однокоренные слова разных частей речи (ПРОИЗВОДСТВО ПРОИЗВОДИТЬ ПРОИЗВЕСТИ ПРОИЗВОДСТВЕННЫЙ ПРОИЗВОДИМЫЙ ПРОИЗВЕДЁННЫЙ и т.д.). В статическом классе Pullenti.Semantic.Utils.DerivateService есть функция FindDerivates(словоформа). Можно из одной части речи в другую, или, например, для несовершенной формы глагола получить совершенную и т.п. Группа содержит не только русские, но и украинские слова (ещё и английские, но тут качество не гарантируется). Подробности см. в документации. Сейчас в словаре около 15000 групп.

СДК на каком языке? межязыковый плагиат = надежда на идентичный корень в славянских языках с общей графикой?

источник

15:11пожаловаться #15

KS

Konstantin Smith in Natural Language Processing

СДК на каком языке? межязыковый плагиат = надежда на идентичный корень в славянских языках с общей графикой?

SDK на 4-х языках: C#, Java, Python и javascript (см. www.pullenti.ru)

источник

15:11пожаловаться #16

AS

Alex Surname in Natural Language Processing

Konstantin Smith

SDK на 4-х языках: C#, Java, Python и javascript (см. www.pullenti.ru)

и что внутри СДК используется чтоб достать корень на англ языке? или полностью самописное?

источник

15:12пожаловаться #17

KS

Konstantin Smith in Natural Language Processing

Этот словарь формировался с 2011 года, сначала полуавтоматически, затем вручную и использовался в нескольких проектах. В частности, для сравнения диссертаций www.dissercomp.ru, который используется в основном украинскими пользователями. Это работает сейчас для русского и украинского языках, на английский не стоит здесь обращать внимание.

источник

15:15пожаловаться #18

AS

Alex Surname in Natural Language Processing

то есть вы вручную повбивали слово => корень? понятно

источник

15:16пожаловаться #19

KS

Konstantin Smith in Natural Language Processing

то есть вы вручную повбивали слово => корень? понятно

Корня там явно нет, просто слова объединялись в группу. Была идея, что делать синонимию, модель управления и пр. не на уровне слов, а на уровне групп.

источник

15:23пожаловаться #20