Равные права, равные возможности!

Как создаются голоса для синтезатора речи RHVoice

 

RHVoice - синтезатор речи, который вместе с программами экранного доступа помогает незрячим людям cёрфить в интернете, вести соцсети и тд.

Его придумала Ольга Яковлева, однако долгое время выбор голосов в программе был ограничен. В прошлом году незрячий разработчик Артем Плаксин и его команда создали лабораторию новых голосов RHVoice, в которой сегодня можно услышать голоса Артемия Лебедева, Евгения Чебаткова, Натальи Арсеньевой и даже воссозданный голос покойного Юрия Заборовского.

Первый этап создания голосов - запись речевой базы. От качества и чистоты записи зависит итоговый результат, поэтому важно записывать звук в профессиональной студии.

На втором этапе инженер монтажа выделяет из записи отдельные предложения и чистит речевые ошибки.

На третьем этапе инженер звукозаписи убирает излишние шумы, подбирает частотные и другие параметры звучания. Звукорежиссёр должен умело выделять речевые особенности диктора, ведь именно они будут узнаваемы при использовании голоса. Это очень кропотливая работа, требующая высокого уровня мастерства.

Четвёртый этап - отправка подготовленных файлов в специальную программную среду, где записанный звук сопоставляется с текстом. В этот момент каждая буква из текстового файла языкового модуля приобретает свое соответствующее звучание. Таким образом, звуковые файлы превращаются в синтезированный голос.

Тонкие настройки позволяют избежать сильной роботизации голоса, а правильно подобранные частоты помогают каждой букве звучать по-своему. На создание одного голоса требуется от двух до трёх месяцев .

В дальнейшем команда Артема Плаксина планирует заняться созданием голосов и на других языках.

Проект Артема полностью некоммерческий, поэтому ему понадобятся грантовые средства или спонсорская помощь для осуществления задумок.

Источник: Особый взгляд