Size: a a a

Natural Language Processing

2020 November 17

AK

Alexandr Kuklavodovi... in Natural Language Processing
Привет 🙋‍♂️
Подскажите пожалуйста в нелегком вопросе:
Имеется kaldi + vosk model(v10), все бы хорошо, но есть потребность распознавать телефонные аудиозаписи(достаточно скверного качества) со своими профессиональными терминами
а) Есть ли возможность дообучить модель(vosk), скормя n кол-во неразмеченных аудиоданных, если да, то где можно об этом почитать, или как звучит задача
б) Этот вариант не очень удачный, но мб имея NNNN кол-во записей, можно обучить с нуля, при этом есть вопросы о качестве модели, времени ее обучения(случится к 2036)
И вообще как обсотят дела у калди с обучением на неразмеченных данных(вроде как такое имеется 🤗)?
Ps возможно часть вводных упустил
источник

Р

Ромаша in Natural Language Processing
Alexandr Kuklavodovich
Привет 🙋‍♂️
Подскажите пожалуйста в нелегком вопросе:
Имеется kaldi + vosk model(v10), все бы хорошо, но есть потребность распознавать телефонные аудиозаписи(достаточно скверного качества) со своими профессиональными терминами
а) Есть ли возможность дообучить модель(vosk), скормя n кол-во неразмеченных аудиоданных, если да, то где можно об этом почитать, или как звучит задача
б) Этот вариант не очень удачный, но мб имея NNNN кол-во записей, можно обучить с нуля, при этом есть вопросы о качестве модели, времени ее обучения(случится к 2036)
И вообще как обсотят дела у калди с обучением на неразмеченных данных(вроде как такое имеется 🤗)?
Ps возможно часть вводных упустил
https://t.me/speech_recognition_ru вот тут лучше поискать ответ
источник

AK

Alexandr Kuklavodovi... in Natural Language Processing
ок, спасибо)
источник

NS

Nikolay Shchipitsin in Natural Language Processing
#РозыгрышХуди

https://sc2020.ai-community.com/
источник

NS

Nikolay Shchipitsin in Natural Language Processing
Вдруг кому интересно станет
источник
2020 November 18

AK

Alexander Kukushkin in Natural Language Processing
SBERT

СберДевайсы выложили BERT-large для русского языка. Он в 3 раза больше RuBERT от Deeppavlov. Чуть-чуть описания в https://habr.com/ru/company/sberdevices/blog/527576/ со слов "Эксперименты с русской моделью NLU". Кто-то пробовал?
источник

VG

Vitaly Gridasov in Natural Language Processing
Всем привет! Есть тексты с новостных, статейных сайтов. Нужно определить к каким категориям относится текст. Категорий около 200, но для начала планируется ограничиться до 5-10 категорий. Язык французский.
Вопрос: насколько затратна реализация задачи по времени и по деньгам?
источник

MT

Mikhail Tikhomirov in Natural Language Processing
О как, надо попробовать эту новую модельку
источник

SancheZz Мов in Natural Language Processing
Alexander Kukushkin
SBERT

СберДевайсы выложили BERT-large для русского языка. Он в 3 раза больше RuBERT от Deeppavlov. Чуть-чуть описания в https://habr.com/ru/company/sberdevices/blog/527576/ со слов "Эксперименты с русской моделью NLU". Кто-то пробовал?
Пробовали конечно)
источник

SancheZz Мов in Natural Language Processing
Но надо понимать что deep pavlov base 12 768
источник

SancheZz Мов in Natural Language Processing
А тут large 24 1024
источник

SancheZz Мов in Natural Language Processing
Конечно побольше будет
источник

MT

Mikhail Tikhomirov in Natural Language Processing
С нетерпением буду ждать ответы, которые Александр задал в комментариях на хабре, ибо действительно важные моменты.
источник

MK

Max Kuznetsov in Natural Language Processing
Futorio Franklin
Будет доступна запись?
+1 Очень хочется послушать или почитать.
источник

ДС

Дмитрий Симаков... in Natural Language Processing
Huggingface - пока нет, я спрашивал.
источник

SancheZz Мов in Natural Language Processing
Дмитрий Симаков
Huggingface - пока нет, я спрашивал.
В процессе)
источник

SancheZz Мов in Natural Language Processing
Я думаю, ответим централизованно, на комменты в хабр
источник

NM

Nick Mikhailovsky in Natural Language Processing
Futorio Franklin
Будет доступна запись?
Да, все будет. Как только выложим - пришлю
источник

NM

Nick Mikhailovsky in Natural Language Processing
Max Kuznetsov
+1 Очень хочется послушать или почитать.
Все будет, ссылку кину
источник

MK

Max Kuznetsov in Natural Language Processing
Nick Mikhailovsky
Все будет, ссылку кину
Круто 👍🏿
источник