Size: a a a

Startup never sleeps

2020 March 04

V

Vlad in Startup never sleeps
Там уже обученная модель в комплекте идёт, я его тоже для синтеза использую. Так же он позволяет задать ударение принудительно знаком + после гласной
источник

V

Vlad in Startup never sleeps
Только ваш синтез речи должен понимать эти ударения, использовать модель синтеза речи, обученную без расстановки ударений не получится
источник

M

Mark in Startup never sleeps
Katya Mineeva
Ну вот хочется это в синтезе использовать, а там каждый раз запрос к корпусу делать не хочется. Плюс я не до конца понимаю, как именно использовать корпус в таком случае?
так у вас модель, которая синтезирует, по идее умеет в ударение
источник

M

Mark in Startup never sleeps
можете просто доучить её на акцентологическом корпусе
источник

V

Vlad in Startup never sleeps
Если используют например Tacotron2, то он не понимает ударения из коробки)
источник

M

Mark in Startup never sleeps
Vlad
Если используют например Tacotron2, то он не понимает ударения из коробки)
вопрос, наверное, в том, что модель умеет учить ударение в слове, но не умеет учить ударение в слове в контексте
источник

KM

Katya Mineeva in Startup never sleeps
Vlad
Только ваш синтез речи должен понимать эти ударения, использовать модель синтеза речи, обученную без расстановки ударений не получится
оооо, хорошо, что я сюда написала! тогда еще вопрос: как сделать так, чтобы сетка одновременно могла ставить ударения, там где стоит токен, и умела догадываться, если токена нет? обучать на смеси: с токенами и без?
источник

M

Mark in Startup never sleeps
вообще, кажется, что проблема типичная, наверняка есть уже какая-то готовая модель
источник

V

Vlad in Startup never sleeps
Я пробовал обучать Tacotron2 на размеченном корпусе с ударениями. Получилось не очень, где-то правильно ударение, где-то нет, а указание ударений вручную тоже через раз работает

А при использовании russian_g2p такой проблемы нету, ибо он так же переводит текст в набор фонем, и автоматом их помечает ударными и безударными. В таком случае модель крайне хорошо реагирует на ударения и в принципе сама их расставляет (за исключением ФИО, их по факту только по словарю можно правильно произносить)
источник

V

Vlad in Startup never sleeps
Katya Mineeva
оооо, хорошо, что я сюда написала! тогда еще вопрос: как сделать так, чтобы сетка одновременно могла ставить ударения, там где стоит токен, и умела догадываться, если токена нет? обучать на смеси: с токенами и без?
russian_g2p это всё и так делает)
вам просто нужно весь текст для синтеза (как для обучения, так и для использования), пропускать через russian_g2p, и на его результате обучать модель
источник

V

Vlad in Startup never sleeps
Если учить модель синтеза только на голом тексте, то ударения где-то внутри себя нейронка может и ставит, но это неуправляемый процесс и неправильное произношение никак не выправить, только обучением заново
источник

KM

Katya Mineeva in Startup never sleeps
Vlad
Я пробовал обучать Tacotron2 на размеченном корпусе с ударениями. Получилось не очень, где-то правильно ударение, где-то нет, а указание ударений вручную тоже через раз работает

А при использовании russian_g2p такой проблемы нету, ибо он так же переводит текст в набор фонем, и автоматом их помечает ударными и безударными. В таком случае модель крайне хорошо реагирует на ударения и в принципе сама их расставляет (за исключением ФИО, их по факту только по словарю можно правильно произносить)
круто, спасибо! вообще я думала, что по задумке такотрон должен выучивать какие-то закономерности того, как в языке ставится ударение и +-правильно догадываться?
источник

V

Vlad in Startup never sleeps
В русском языке даже обычным людям сложно в некоторых местах правильно ударение поставить, а вы такое от нейронки хотите...)
источник

KM

Katya Mineeva in Startup never sleeps
Vlad
В русском языке даже обычным людям сложно в некоторых местах правильно ударение поставить, а вы такое от нейронки хотите...)
Это да)
источник

OB

Oleg Basistyy in Startup never sleeps
Всем привет!

Тут IBM организует в Питере семинары по AI и ML (IBM Watson) и DevOps-у с прицелом на стартапы. Привозит прям крутых спикеров и вписывает в грантовую программу на облака.

Регистрация на все 4 ивента тут: https://tini.to/SwK

Я участвую в продвижении так что вот один из рожденных в процессе мемасов в качестве бонуса:)
источник

В

Вахтер in Startup never sleeps
Добро пожаловать
источник

В

Вахтер in Startup never sleeps
@vasilysdobnov молчит и покидает чат.
источник
2020 March 05

SK

Sergey Kulik in Startup never sleeps
#whois
Привет, я Сергей, сейчас разработчик бекенда в Яндексе.
Закончил универ и ШАД в Минске, сейчас перебрался в Москву.
Стажировался в Bing в Белвью в 2017 году.
источник

В

Вахтер in Startup never sleeps
Sergey Kulik
#whois
Привет, я Сергей, сейчас разработчик бекенда в Яндексе.
Закончил универ и ШАД в Минске, сейчас перебрался в Москву.
Стажировался в Bing в Белвью в 2017 году.
@zxqfd555, Спасибо, вы приняты в сообщество! У нас целая экосистема чатов, подробнее в закрепленном сообщении.
источник

DS

Dmitry Shchelchkov in Startup never sleeps
Sergey Kulik
#whois
Привет, я Сергей, сейчас разработчик бекенда в Яндексе.
Закончил универ и ШАД в Минске, сейчас перебрался в Москву.
Стажировался в Bing в Белвью в 2017 году.
Привет Сергей!
Разработчик бэкенда чего?
источник