Size: a a a

Natural Language Processing

2021 June 03

SancheZz Мов in Natural Language Processing
Енот вай нот
источник

SancheZz Мов in Natural Language Processing
Но я бы еще temporary cnn попробовал
источник

T

Timur in Natural Language Processing
это которые каузальные?
источник

SancheZz Мов in Natural Language Processing
Которые аля wavenet
источник

SancheZz Мов in Natural Language Processing
С временными темами
источник

T

Timur in Natural Language Processing
там каузальные + с разными дилейшнами на разных слоях вроде как
я уже не помню 🥺
источник

T

Timur in Natural Language Processing
вот такие
источник

SancheZz Мов in Natural Language Processing
Ага
источник

AP

Alex Pushkina in Natural Language Processing
Всем привет! Кто-нибудь пробовал делать Entity Linking для русского языка? Какие фреймворки кроме spaCy можно было бы использовать? Может быть встречались какие-нибудь статьи? Если кто-нибудь  тренировал русскую модель в spaCy 3.0, дайте знать. Заранее спасибо!
источник

AO

Alex Orgish in Natural Language Processing
@AlexPushkina , для английского есть отличный https://github.com/facebookresearch/BLINK
источник

AP

Alex Pushkina in Natural Language Processing
Я его кажется видела. Но у меня задание именно с русским. Все равно спасибо, лишним не будет ознакомиться :)
источник

TM

Toemik Mnemonic in Natural Language Processing
привет! А что подскажите использовать для того что бы как то(?) отобразить в pplot положение слов относительно друг друга в двухмерном пространстве на основе векторов слов (word2vec, toc2vec)? еслть какой то фреймворк для этого или подход типичный?
источник

IS

I Sh in Natural Language Processing
уменьшите размерность векторов до двух измерений - например, с помощью PCA или umap
источник

NK

Nikolay Karelin in Natural Language Processing
Umap, и правильно параметры подобрать
источник

VF

Vadim Fomin in Natural Language Processing
tsne ещё)
источник

РН

Роман Некрасов... in Natural Language Processing
t-SNE отличный алгоритм. К сожалению, лишь инструмент визуализации. Если на входе нет инсайтов, то и на выходе t-SNE их не появится ((
источник

Е

Егорка in Natural Language Processing
Так здесь как раз речь о визуализации.
Кроме того, согласно постановки задачи достаточно указать косинусную меру близости в гиперпараметрах, чтобы получить осмысленную визуализацию.
источник

TM

Toemik Mnemonic in Natural Language Processing
Все так . Всем спасибо за ответы
источник
2021 June 04

A

Andrew in Natural Language Processing
Спасибо за ответ. Однако странно что нельзя 🤔. Тогда может быть кто-нибудь подскажет эффективный алгоритм для анонимизации сущеностей?
Суть задачи такая: есть обращения граждан с различными проблемами (окло 120+ тыс обращений) - исходные данные. Нужно анонимизоровать фио граждан, телефоны, адреса.... пароли-явки, но при этом фио должностных лиц (чиновников, министров, замов, губернатора и т.д.) анонимизровать нелья, чтобы в итоге можно было понять кому адресовано обращение, но не было видно от кого обращение.
источник

IS

I Sh in Natural Language Processing
А разве так не получится?

list_of_officials = ('имя', 'ещё имя',)

for token in doc.tokens:
   if token.lemma not in list_of_officials:
       anonymize()
источник