AK
Подскажите пожалуйста в нелегком вопросе:
Имеется kaldi + vosk model(v10), все бы хорошо, но есть потребность распознавать телефонные аудиозаписи(достаточно скверного качества) со своими профессиональными терминами
а) Есть ли возможность дообучить модель(vosk), скормя n кол-во неразмеченных аудиоданных, если да, то где можно об этом почитать, или как звучит задача
б) Этот вариант не очень удачный, но мб имея NNNN кол-во записей, можно обучить с нуля, при этом есть вопросы о качестве модели, времени ее обучения(случится к 2036)
И вообще как обсотят дела у калди с обучением на неразмеченных данных(вроде как такое имеется 🤗)?
Ps возможно часть вводных упустил