Телеграмм чат группы natural_language_processing страница 1338

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Natural Language Processing

3198 membersпожаловаться на группу

2021 July 19

AE

Anton Eryomin in Natural Language Processing

Добрый день! а какие сейчас самые самые SOTA эмбеддинги для русского языка? Нужно поиграться с текстами, хочется понять отправную точку.

источник

09:32пожаловаться #1

SМ

SancheZz Мов in Natural Language Processing

Вам дистрибутивные модели или трансформеры?)

источник

09:56пожаловаться #2

AE

Anton Eryomin in Natural Language Processing

хотелось бы конечно Трансформеры, но и дистрибутивные тоже хорошо

источник

09:57пожаловаться #3

KL

Kir L in Natural Language Processing

если не нужно прям сота пересота, а достаточно гуд энаф из коробки, то для предложений или недлинных текстов посоветую USE.

источник

10:52пожаловаться #4

t2

tonko 22 in Natural Language Processing

А какие сейчас самые популярные (sota/cheap tradeoff) подходы ддя получения эмбеддингов длинных текстов?

источник

10:57пожаловаться #5

YA

Yerlan Amanzholov in Natural Language Processing

Всем привет! Есть задача классификации интентов, но проблема в том, что в среднем 10-15 примеров для каждого интента и большое количество интентов. Есть ли какой нибудь способ получить нормальное качество на таком датасете или это гиблое дело?

источник

10:57пожаловаться #6

KL

Kir L in Natural Language Processing

нет, это вполне нормальный датасет для такой задачи. Но по лучшему выбору подхода/модели не подскажу ((( наверно надо гуглить по запросу few-shot text classification

источник

11:01пожаловаться #7

KL

Kir L in Natural Language Processing

сам собираюсь в ближайшее время делать модель по таким же данным, думаю начать с чего-то типа USE + классические алгоритмы

источник

11:02пожаловаться #8

ДС

Дмитрий Симаков... in Natural Language Processing

Эмбеддинги + knn

источник

11:02пожаловаться #9

KL

Kir L in Natural Language Processing

поддержу

источник

11:03пожаловаться #10

YA

Yerlan Amanzholov in Natural Language Processing

Примерно такой пайплай используем, хотелось улучшить и пробовал файнтюнить трансформеры, но качество не радует

источник

11:04пожаловаться #11

ДС

Дмитрий Симаков... in Natural Language Processing

Вообще, few shot подходы есть специальные. Но я всего пару раз запускал.

источник

11:04пожаловаться #12

ДС

Дмитрий Симаков... in Natural Language Processing

Можно попробовать пофайнтюнить при помощи метрик ленинг или unsupervised (если самих текстов много). Но это все не факт, что заведётся.

источник

11:05пожаловаться #13

ДС

Дмитрий Симаков... in Natural Language Processing

Типо Prototypical Network

источник

11:06пожаловаться #14

YA

Yerlan Amanzholov in Natural Language Processing

Одна из главных проблем то, что модель даже если предсказывает правильно, но с очень маленьким конфиденсом

источник

11:07пожаловаться #15

YA

Yerlan Amanzholov in Natural Language Processing

Нормально ли такое при большом количестве классов?

источник

11:07пожаловаться #16

KL

Kir L in Natural Language Processing

если суммарный конфиденс 1, то это очевидно так и будет(

источник

11:08пожаловаться #17

KL

Kir L in Natural Language Processing

хотя нет, наверно я не совсем прав

источник

11:08пожаловаться #18

A

Andrey in Natural Language Processing

отчасти потому что примеров мало, отчасти потому что интентов много.

лучше knn хз что придумать тут, модель поближе к домену поискать может стоит.

источник

11:22пожаловаться #19

d

dePuff in Natural Language Processing

Можно эмбединги свернуть в эмбединги меньшего размера полносвязной и триплет лоссом

источник

11:25пожаловаться #20