RHVoice — синтезатор речи, который вместе с программами экранного доступа помогает незрячим людям cёрфить в интернете, вести соцсети и т.д.
Его придумала Ольга Яковлева, однако долгое время выбор голосов в программе был ограничен. В прошлом году незрячий разработчик Артем Плаксин и его команда создали лабораторию новых голосов RHVoice, в которой сегодня можно услышать голоса Артемия Лебедева, Евгения Чебаткова, Натальи Арсеньевой и даже воссозданный голос покойного Юрия Заборовского.
Первый этап создания голосов — запись речевой базы. От качества и чистоты записи зависит итоговый результат, поэтому важно записывать звук в профессиональной студии.
На втором этапе инженер монтажа выделяет из записи отдельные предложения и чистит речевые ошибки.
На третьем этапе инженер звукозаписи убирает излишние шумы, подбирает частотные и другие параметры звучания. Звукорежиссёр должен умело выделять речевые особенности диктора, ведь именно они будут узнаваемы при использовании голоса. Это очень кропотливая работа, требующая высокого уровня мастерства.
Четвёртый этап — отправка подготовленных файлов в специальную программную среду, где записанный звук сопоставляется с текстом. В этот момент каждая буква из текстового файла языкового модуля приобретает свое соответствующее звучание. Таким образом, звуковые файлы превращаются в синтезированный голос.
Тонкие настройки позволяют избежать сильной роботизации голоса, а правильно подобранные частоты помогают каждой букве звучать по-своему. На создание одного голоса требуется от двух до трёх месяцев .
В дальнейшем команда Артема Плаксина планирует заняться созданием голосов и на других языках.
Проект Артема полностью некоммерческий, поэтому ему понадобятся грантовые средства или спонсорская помощь для осуществления задумок.
Источник: Особый взгляд