Наши проекты:
Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту |
||
ПРАВИЛА | FAQ | Помощь | Поиск | Участники | Календарь | Избранное | RSS |
[3.236.100.210] |
|
Сообщ.
#1
,
|
|
|
здравствуйте.
есть задача тренировать голос для rhvoice. для начала я выбрал елену. есть установленное окружение состоящяя из: hts2.2, htsengine1.5, festival2.1.1, festvox2.5.3, speechtools2.1.1, sptk3.4.1 все это работает на linux. также установлены rhvoice transcribe sentences и rhvoice hts labeller использую последние скрипты из гита. вопрос. что надо перенести из демонстрационного примера? я удалил все что косалось англ голоса, сделал ./prepare for training setup, ./prepare for training import-recordings эти два этапа прошли нормально. подскажите пожалуйста, что делать дальше? спасибо большое заранее. |
Сообщ.
#2
,
|
|
|
Надо заменить исходные raw- и utt-файлы на аналогичные из голоса Елена. Ссылку на 16кГц голос от nsh с метками отправлял в лс. Отсюда взял метки, тк они проставлены в секундах, а русскую базу с голосом Елены (48кГц) - со стр. RHVoice.
Далее готовишь данные и запускаешь тренировочные скрипты. Синтез голоса. К Русскому голосу английская лексика не подходит, поэтому можно сделать как в RHVoice или преобразовать лексику как в Flite. Английский голос slt хорошо тренируется на 100-1000 файлах. Тренировку голоса Елены также начинал со 100 файлов, но получился шум, немного похожий на женский голос. Может быть нужно брать больше файлов, а может быть метки от 16кГц не подошли к 48кГц-м файлам, может быть есть др. причины (вопросы от английского голоса). |