Телеграмм чат группы natural_language

https://simpletransformers.ai/docs/multi-label-classification/

Simple Transformers

Multi-Label Classification

Multi-label text classification.

09:53пожаловаться #1

Блин так разметка данных очень дорого обойдётся ) я скорее про получение one hot при классификации автоматом . Модель же считает loss, значит в кишках где то и есть возможность вернуть {3:0.85, 1:0.1, 2:0.05} вместо просто 3. Но видимо через интерфейс simpletransformers не получится

10:04пожаловаться #2

И это есть там

model_outputs же доступен (predict возвращает второй сущностью)

10:12пожаловаться #3

Думаю, там логиты будут, но ничто не мешает софтмакснуть их

10:14пожаловаться #4

то есть такой объект можно вернуть и с ClassificationModel?

10:18пожаловаться #5

Binary text classification.

Ну вот оно же https://simpletransformers.ai/docs/binary-classification/
в 38й и 41й строке примера )

Simple Transformers

Binary Classification

Alexander in Natural Language Processing

10:19пожаловаться #6

Коллеги, query, key и values это ведь все обучаемые вектора? Градиентным спуском?

10:20пожаловаться #7

спасибо, запускаю как раз

Максим Антонов... in Natural Language Processing

10:22пожаловаться #8

МА

Привет. А кто-нибудь пользует Yandex.DataSphere?

Я вот решил попробовать, чтобы не мучить ноутбук. Даже %pip install не могу исполнить. Говорит нет сети. К подсетке, куда включен блокнот - нат включил. Не помогло.

Может кто знает как заставить это работать?

10:22пожаловаться #9

так точно)

10:35пожаловаться #10

Точно нет. Механизмы внимания, кстати, есть разные.

10:38пожаловаться #11

Но, как вариант, мы учим градиентным спуском три матрицы (по сути отдельные нейросетки)

И вот мы перемножаем эмбединги на первую такую матрицу и у нас на выходе вектор query

Alexander in Natural Language Processing

10:47пожаловаться #12

Да, точно, спасибо, через промежуточные три матрицы, каждая матрица для всех векторов одного типа(например для query)

Сообщество разработчиков и аналитиков Yandex DataSphere. Делимся опытом, идеями и обсуждаем технические вопросы.

Как что работает: cloud.yandex.ru/docs/datasphere

Посты о мероприятиях и анонсы только после согласования с админами: @djiko или @AlenaDrob

10:54пожаловаться #13

I Sh in Natural Language Processing

попробуйте сюда написать: https://t.me/yandex_datasphere

Yandex DataSphere Community

Максим Антонов... in Natural Language Processing

10:56пожаловаться #14

МА

Спасибо

Alexander Fedorenko in Natural Language Processing

11:55пожаловаться #15

для старта можно просто взять абзацы и по ним сделать кластеризацию и выбрать по кластерам ключевые слова и посмотреть что получилось)

UPD Даже, наверное будет лучше, сначала документы прогнать через кластеризацию, чтобы инструкции в одну сторону, статьи в другую, а новости в третью) Это если получится. А ужа затем в рамках документов из кластера углубляться в детали)

12:32пожаловаться #16

А чем продвинутые ребята делают Under-sampling, если хочется, например, уменьшить датасет в 10 раз, но оставить самые разнообразные примеры?
И чтобы это не занимало вечность

13:21пожаловаться #17

Maksym in Natural Language Processing

#jobs_Hr
Платим 1000$ за рекомендацию NLP Engineer!

К нам в Metinvest Digital R&D очень нужен NLP Engineer. Ищем уровня Middle/Senior.
Задачи такие, как, conversational solutions, text parsing, mood analysis, Intelligent OCR.

Мало рутины, много рессерча и нестандартных задач. Скучно точно не будет.
Доступен remote, поэтому идеальный кандидат может быть с любой точки Украины.

Anton Cherepkov in Natural Language Processing

13:59пожаловаться #18

Почему именно Украины?

David Dale in Natural Language Processing

14:00пожаловаться #19

Почему я ощущаю дежавю?