Size: a a a

Natural Language Processing

2021 September 15

d

dePuff in Natural Language Processing
источник

TM

Toemik Mnemonic in Natural Language Processing
Блин так разметка данных очень дорого обойдётся ) я скорее про получение one hot при классификации автоматом . Модель  же считает loss, значит в кишках где то и есть возможность вернуть {3:0.85, 1:0.1, 2:0.05} вместо просто 3. Но видимо через интерфейс simpletransformers не получится
источник

d

dePuff in Natural Language Processing
И это есть там

model_outputs же доступен (predict возвращает второй сущностью)
источник

d

dePuff in Natural Language Processing
Думаю, там логиты будут, но ничто не мешает софтмакснуть их
источник

TM

Toemik Mnemonic in Natural Language Processing
то есть такой объект можно вернуть и с ClassificationModel?
источник

d

dePuff in Natural Language Processing
Ну вот оно же https://simpletransformers.ai/docs/binary-classification/
в 38й и 41й строке примера )
источник

A

Alexander in Natural Language Processing
Коллеги, query, key и values это ведь все обучаемые вектора? Градиентным спуском?
источник

TM

Toemik Mnemonic in Natural Language Processing
спасибо, запускаю как раз
источник

МА

Максим Антонов... in Natural Language Processing
Привет. А кто-нибудь пользует Yandex.DataSphere?

Я вот решил попробовать, чтобы не мучить ноутбук. Даже %pip install не могу исполнить. Говорит нет сети. К подсетке, куда включен блокнот - нат включил. Не помогло.

Может кто знает как заставить это работать?
источник

TM

Toemik Mnemonic in Natural Language Processing
так точно)
источник

d

dePuff in Natural Language Processing
Точно нет. Механизмы внимания, кстати, есть разные.
источник

d

dePuff in Natural Language Processing
Но, как вариант, мы учим градиентным спуском три матрицы (по сути отдельные нейросетки)

И вот мы перемножаем эмбединги  на первую такую матрицу и у нас на выходе вектор query
источник

A

Alexander in Natural Language Processing
Да, точно, спасибо, через промежуточные три матрицы, каждая матрица для всех векторов одного типа(например для query)
источник

IS

I Sh in Natural Language Processing
попробуйте сюда написать: https://t.me/yandex_datasphere
источник

МА

Максим Антонов... in Natural Language Processing
Спасибо
источник

AF

Alexander Fedorenko in Natural Language Processing
для старта можно просто взять абзацы и по ним сделать кластеризацию и выбрать по кластерам ключевые слова и посмотреть что получилось)

UPD Даже, наверное будет лучше, сначала документы прогнать через кластеризацию, чтобы инструкции в одну сторону, статьи в другую, а новости в третью) Это если получится. А ужа затем в рамках документов из кластера углубляться в детали)
источник

d

dePuff in Natural Language Processing
А чем продвинутые ребята делают Under-sampling, если хочется, например, уменьшить датасет в 10 раз, но оставить самые разнообразные примеры?
И чтобы это не занимало вечность
источник

M

Maksym in Natural Language Processing
#jobs_Hr
Платим 1000$ за рекомендацию NLP Engineer!

К нам в Metinvest Digital R&D очень нужен NLP Engineer. Ищем уровня Middle/Senior.
Задачи такие, как, conversational solutions, text parsing, mood analysis, Intelligent OCR.

Мало рутины, много рессерча и нестандартных задач. Скучно точно не будет.
Доступен remote, поэтому идеальный кандидат может быть с любой точки Украины.
источник

AC

Anton Cherepkov in Natural Language Processing
Почему именно Украины?
источник

DD

David Dale in Natural Language Processing
Почему я ощущаю дежавю?
источник