Недавно на Reddit один из пользователей принес вопрос в сообщество машинного обучения:
У отца пользователя диагностировали серьезное неврологическое заболевание (мотонейроонная болезнь), а значит, по прогнозам врачей, жить отцу осталось 3-5 лет, болезнь быстро прогрессирует, он уже не в состоянии передвигаться сам, постепенно будет терять возможность говорить и тп.
Вопрос пользователя заключался в том, какими способами возможно сохранить голос отца, потому что он прекрасно понимает куда все это идет и во первых ему страшно, что он сам забудет через какое-то время какой голос был у отца. Во вторых, когда отец потеряет способность говорить, он смог бы ему помочь сделав для него синтез речи его же голосом для бытовых нужд.
В комментариях много советов, самые популярные я перечислю ниже, но интересным мне показалось другое – уже сейчас в США есть ряд компаний, которые позволяют сделать "Voice banking" и "Phrace banking", верхний комментарий поста как раз от ML-инженера из такой компании.
Voice banking – это когда ML-алгоритм пытается синтезировать голос на основе исходного, вот
тут есть похожий алгоритм, а не так давно так синтезировали
Высоцкого.
Phrase banking – более простая, доступная, но надежная технология: человека просят начитать ряд готовых фраз про разные ситуации, в целом, это тоже может стать датасетом для Voice banking, но стоит значительно дешевле, потому что без ML.
Самые главные советы из поста можно свести к следующему – если у вас есть близкий, голос которого вы бы хотели сохранить:
1) Арендуйте студию звукозаписи на час и просто посидите пообщайтесь о чем-то, где человек бы что-то рассказал о себе.
2) Арендуйте эту же студию на час, но в этот раз, попросите человека почитать какую-то книгу которую он любит.
Этих звукозаписей будет достаточно чтобы получить голос близкого человека даже после его утраты. Самое важное в процессе сохранения голоса это качество звука, поэтому речь идет о студии звукозаписи.
Сейчас для многих, наверное, вся эта тематика кажется жутковатой, но я абсолютно уверен, что цифровые аватары близких людей будут целой индустрией – боль утраты близкого человека невыносимо сложно переживать, люди будут хвататься за любую возможность провести еще немного времени вместе.
Оригинальный тред на Reddit тут:
https://www.reddit.com/r/MachineLearning/comments/er3ng8/d_how_to_save_my_fathers_voice/ Не болейте 💖