Наши проекты:
Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту |
||
ПРАВИЛА | FAQ | Помощь | Поиск | Участники | Календарь | Избранное | RSS |
[34.231.180.210] |
|
Страницы: (19) 1 [2] 3 4 ... 18 19 все ( Перейти к последнему сообщению ) |
Сообщ.
#16
,
|
|
|
Собирается минут за 10 и отлично работает. А как это дело вызывать из консоли, чтобы на scheme не писать команды в интерпретаторе?
Да и большой файл (книжку с fictionbook.ru, около 500КБ) прочитать не может: festival> (tts_file "/home/rad/tmp/text.txt" nil) LTS_Ruleset russian_downcase: no rule matches: LTS_Ruleset: # *here* . . . Ф у н д а м е н т а л ь н о е # closing a file left open: /home/rad/tmp/text.txt festival> Попробовал почитать документацию rad@nemo:~/development/festival/build/festival/bin$ ./festival --language ru --tts ~/tmp/test.txt "Unsupported language, using English" SIOD ERROR: unbound variable : voice_rab_diphone festival: fatal error exiting. rad@nemo:~/development/festival/build/festival/bin$ ./festival --language Russian --tts ~/tmp/test.txt "Unsupported language, using English" SIOD ERROR: unbound variable : voice_rab_diphone festival: fatal error exiting. rad@nemo:~/development/festival/build/festival/bin$ ls ../lib/voices english ru rad@nemo:~/development/festival/build/festival/bin$ ls ../lib/voices/ru/ msu_ru_nsh_clunits rad@nemo:~/development/festival/build/festival/bin$ ./festival --language msu_ru_nsh_clunits --tts ~/tmp/test.txt "Unsupported language, using English" SIOD ERROR: unbound variable : voice_rab_diphone festival: fatal error exiting. |
Сообщ.
#17
,
|
|
|
Цитата LTS_Ruleset: # *here* . . . Ф у н д а м е н т а л ь н о е # Тут дело не в размере файла а в том, что там слишком много не совсем правильных слов. Эту ошибку можно будет исправить в дальшейших версиях, пока же нужно просто это слово стереть. Здесь ему не нравятся точки в начале слова. Цитата Unsupported language, using English" Можно что-то в духе festival -b '(begin (voice_msu_ru_nsh_clunits) (tts_file "a.txt" nil))' Вместо интерпретатора использовать. |
Сообщ.
#18
,
|
|
|
Понял. Спасибо.
Если напишешь как тебе можно помочь с разметкой в русском языке и как изменения от разных добровольцев будут объединяться, думаю народ поможет. |
Сообщ.
#19
,
|
|
|
Как помочь, скачиваете базу, скачиваете Wavesurfer. Открываете файл .wav и делаете загрузку транскрипций из файла .lab. Исправляете транскрипцию, сохраняете. Присылаете мне исправленные файлы .lab.
|
Сообщ.
#20
,
|
|
|
Фестиваль только для линукса?
|
Сообщ.
#21
,
|
|
|
Нет, можно и под win использовать, скачав:
http://www.cs.dal.ca/~lalita/festival/win32/festival_1.95-beta_win32.zip Полное руководство по сборке тут: http://flame.cs.dal.ca/~lalita/festival/festivalXP.htm Можно ещё использовать cygwin или поставить linux в виртуальной машине vmware. В целом как-то надо сделать вариант с поддержкой SAPI, но руки не доходят. |
Сообщ.
#22
,
|
|
|
nsh
Цитата nsh @ Как помочь, скачиваете базу, скачиваете Wavesurfer. Открываете файл .wav и делаете загрузку транскрипций из файла .lab. То есть вы хотите сказать, что в принципе можно каким то образом довести качество до вашего образца, чтобы голос в авторежиме так наговаривал? И насколько это реально по времени? Жалко, что я не спец и не в линуксе. |
Сообщ.
#23
,
|
|
|
Еще раз, то что я выложил и есть автоматический режим. Rad может подтвердить. Ручной разметкой можно довести качество до натуральной речи.
А размечать не сложно, попробуйте. |
Сообщ.
#24
,
|
|
|
nsh
Но тогда какой смысл размечать вручную, если, например, хочешь послушать книжку? А есть что то вроде внутреннего корректируемого словаря ударений как у мультимедийного Коли? Плиз, выложите ещё один образец сложного предложения без ручной размётки. |
Сообщ.
#25
,
|
|
|
http://nshmyrev.narod.ru/temp/example3.wav
|
Сообщ.
#26
,
|
|
|
А где можно ознакомиться с правилами транскрипции?
|
Сообщ.
#27
,
|
|
|
Правила транскрипции описаны в файле festvox/msu_ru_nsh_lexicon.scm. Они основываются на работе Л.М. Захарова - http://www.philol.msu.ru/~otipl/SpeechGroup/publications/2004/z-4.doc. Ещё можно прочесть книжку по фонетике - Бондарко тут выложена, например.
В целом же нужно исправлять границы фонем, а не саму транскрипцию. Разве что ударения исправить иногда. |
Сообщ.
#28
,
|
|
|
щелчки можно убирать автоматически, несложная функция
я так понимаю, ручное исправление - один раз откорректированная база звуков справедлива для любого текста (как и скорректированный словарь ударений), а то может сложиться представление, что для каждой фразы нужно ее править вручную, чтоб звучала хорошо |
Сообщ.
#29
,
|
|
|
Ты имеешь в виду, разбивку поправить автоматом, или на созданном wav функцию прогнать?
|
Сообщ.
#30
,
|
|
|
разбивку поправить
to nsh: вас не затруднит в двух словах описать принцип, по которому в фестивале происходит разбивка наговорённых файлов на элементы транскрипции? распознавание? |