На главную
ПРАВИЛА FAQ Помощь Участники Календарь Избранное DigiMania RSS
msm.ru
Модераторы: RaD, nsh
Страницы: (19) 1 [2] 3 4 ...  18 19 все  ( Перейти к последнему сообщению )  
> Новая база для синтеза речи, и голос для festival
    Собирается минут за 10 и отлично работает. А как это дело вызывать из консоли, чтобы на scheme не писать команды в интерпретаторе?

    Да и большой файл (книжку с fictionbook.ru, около 500КБ) прочитать не может:

    ExpandedWrap disabled
      festival> (tts_file "/home/rad/tmp/text.txt" nil)
      LTS_Ruleset russian_downcase: no rule matches:
      LTS_Ruleset: # *here*       . . . Ф у н д а м е н т а л ь н о е #
      closing a file left open: /home/rad/tmp/text.txt
      festival>


    Попробовал почитать документацию :)
    ExpandedWrap disabled
      rad@nemo:~/development/festival/build/festival/bin$ ./festival --language ru --tts ~/tmp/test.txt
      "Unsupported language, using English"
      SIOD ERROR: unbound variable : voice_rab_diphone
      festival: fatal error exiting.
      rad@nemo:~/development/festival/build/festival/bin$ ./festival --language Russian --tts ~/tmp/test.txt
      "Unsupported language, using English"
      SIOD ERROR: unbound variable : voice_rab_diphone
      festival: fatal error exiting.
      rad@nemo:~/development/festival/build/festival/bin$ ls ../lib/voices
      english  ru
      rad@nemo:~/development/festival/build/festival/bin$ ls ../lib/voices/ru/
      msu_ru_nsh_clunits
      rad@nemo:~/development/festival/build/festival/bin$ ./festival --language msu_ru_nsh_clunits --tts ~/tmp/test.txt
      "Unsupported language, using English"
      SIOD ERROR: unbound variable : voice_rab_diphone
      festival: fatal error exiting.
    DjangoBook по-русски & Проекты съедают моё свободное время.
    Творите на питоне - цените своё время.
      Цитата
      LTS_Ruleset: # *here* . . . Ф у н д а м е н т а л ь н о е #


      Тут дело не в размере файла а в том, что там слишком много не совсем правильных слов. Эту ошибку можно будет исправить в дальшейших версиях, пока же нужно просто это слово стереть. Здесь ему не нравятся точки в начале слова.

      Цитата
      Unsupported language, using English"


      Можно что-то в духе

      festival -b '(begin (voice_msu_ru_nsh_clunits) (tts_file "a.txt" nil))'

      Вместо интерпретатора использовать.
      http://nshmyrev.blogspot.com
        Понял. Спасибо.

        Если напишешь как тебе можно помочь с разметкой в русском языке и как изменения от разных добровольцев будут объединяться, думаю народ поможет.
        DjangoBook по-русски & Проекты съедают моё свободное время.
        Творите на питоне - цените своё время.
          Как помочь, скачиваете базу, скачиваете Wavesurfer. Открываете файл .wav и делаете загрузку транскрипций из файла .lab. Исправляете транскрипцию, сохраняете. Присылаете мне исправленные файлы .lab.
          http://nshmyrev.blogspot.com
            Фестиваль только для линукса?
              Нет, можно и под win использовать, скачав:

              http://www.cs.dal.ca/~lalita/festival/win32/festival_1.95-beta_win32.zip

              Полное руководство по сборке тут:

              http://flame.cs.dal.ca/~lalita/festival/festivalXP.htm

              Можно ещё использовать cygwin или поставить linux в виртуальной машине vmware. В целом как-то надо сделать вариант с поддержкой SAPI, но руки не доходят.
              Сообщение отредактировано: nsh -
              http://nshmyrev.blogspot.com
                nsh
                Цитата nsh @
                Как помочь, скачиваете базу, скачиваете Wavesurfer. Открываете файл .wav и делаете загрузку транскрипций из файла .lab.

                То есть вы хотите сказать, что в принципе можно каким то образом довести качество до вашего образца, чтобы голос в авторежиме так наговаривал? И насколько это реально по времени? Жалко, что я не спец и не в линуксе.
                  Еще раз, то что я выложил и есть автоматический режим. Rad может подтвердить. Ручной разметкой можно довести качество до натуральной речи.

                  А размечать не сложно, попробуйте.
                  http://nshmyrev.blogspot.com
                    nsh
                    Но тогда какой смысл размечать вручную, если, например, хочешь послушать книжку? А есть что то вроде внутреннего корректируемого словаря ударений как у мультимедийного Коли? Плиз, выложите ещё один образец сложного предложения без ручной размётки.
                      http://nshmyrev.narod.ru/temp/example3.wav
                      http://nshmyrev.blogspot.com
                        А где можно ознакомиться с правилами транскрипции?
                        DjangoBook по-русски & Проекты съедают моё свободное время.
                        Творите на питоне - цените своё время.
                          Правила транскрипции описаны в файле festvox/msu_ru_nsh_lexicon.scm. Они основываются на работе Л.М. Захарова - http://www.philol.msu.ru/~otipl/SpeechGroup/publications/2004/z-4.doc. Ещё можно прочесть книжку по фонетике - Бондарко тут выложена, например.

                          В целом же нужно исправлять границы фонем, а не саму транскрипцию. Разве что ударения исправить иногда.
                          http://nshmyrev.blogspot.com
                            щелчки можно убирать автоматически, несложная функция

                            я так понимаю, ручное исправление - один раз откорректированная база звуков справедлива для любого текста (как и скорректированный словарь ударений),
                            а то может сложиться представление, что для каждой фразы нужно ее править вручную, чтоб звучала хорошо
                            Сообщение отредактировано: Iskanderus -
                            Старый глюк лучше новых двух (с)
                              Ты имеешь в виду, разбивку поправить автоматом, или на созданном wav функцию прогнать?
                              DjangoBook по-русски & Проекты съедают моё свободное время.
                              Творите на питоне - цените своё время.
                                разбивку поправить


                                to nsh:
                                вас не затруднит в двух словах описать принцип, по которому в фестивале происходит разбивка наговорённых файлов на элементы транскрипции? распознавание?
                                Сообщение отредактировано: Iskanderus -
                                Старый глюк лучше новых двух (с)
                                0 пользователей читают эту тему (0 гостей и 0 скрытых пользователей)
                                0 пользователей:
                                Страницы: (19) 1 [2] 3 4 ...  18 19 все


                                Рейтинг@Mail.ru
                                [ Script Execution time: 0,1070 ]   [ 16 queries used ]   [ Generated: 25.06.17, 01:59 GMT ]