На главную Наши проекты:
Журнал   ·   Discuz!ML   ·   Wiki   ·   DRKB   ·   Помощь проекту
ПРАВИЛА FAQ Помощь Участники Календарь Избранное RSS
msm.ru
Модераторы: RaD, nsh
Страницы: (19) « Первая ... 9 10 [11] 12 13 ...  18 19 все  ( Перейти к последнему сообщению )  
> Новая база для синтеза речи , и голос для festival
    Цитата
    Этот вопрос задаю от того, что пытаюсь сделать озвучку для символов, но не во всех случаях, а только когда он указан отдельно.


    Да, если символ отдельный, его нужно просто добавить в словарь

    Цитата
    сли же он входит в состав слова - то его не надо произносить.


    В этом случае для *

    ExpandedWrap disabled
      ( [ "*" ] = )
      Цитата nsh @
      Цитата
      Этот вопрос задаю от того, что пытаюсь сделать озвучку для символов, но не во всех случаях, а только когда он указан отдельно.


      Да, если символ отдельный, его нужно просто добавить в словарь

      Цитата
      сли же он входит в состав слова - то его не надо произносить.


      В этом случае для *

      ExpandedWrap disabled
        ( [ "*" ] = )

      Вот что у меня происходит.
      Ставлю в Ubuntu Festival и голос из репозиториев. Затем произношу "*" и получаю ошибку. Затем я иду в msu_ru_nsh_lexicon.scm и вижу что есть следующий блок


      ExpandedWrap disabled
        (define (msu_ru_addenda)
          "(msu_ru_addenda)
        Basic lexicon should (must ?) have basic letters, symbols and punctuation."
         
        ;;; Symbols ...
        (lex.add.entry
        '("*" nil (((u) 0) ((m n o) 1) ((zh i tt) 0) )))


      Казалось бы должно звучать "умножить". Но отдельно стоящая звездочка приводит к ошибке.

      Далее, я добавляю в
      ExpandedWrap disabled
        (lts.ruleset
         russian_downcase


      строки

      ExpandedWrap disabled
        ( [ "*" ] = )


      После чего запускаю Festival и прошу сказать отдельностоящую "*" ...
      и слышу нечто напоминающее "Найду"...

      Тоже произойдет если я добавлю

      ExpandedWrap disabled
        ( [ "%" ] = )
        ( [ "|" ] = )


      и попрошу произнести.

      Впрочем, тоже самое происходит и в Windows XP при загруженном по вашей ссылке актуальных festival и голосе.

      Я не понимаю, откуда он выковыривает это "найду", или что он у меня там говорит.
        Хорошо, попробуйте так:

        ExpandedWrap disabled
          (lex.add.entry
           '("\*" nil ( ((u) 0) ((m n o) 1) ((zh i tt) 0) )))
           
          (lts.ruleset
           russian_downcase
           ( )
           ....
              ( [ "*" ] =  "*" )
           ....
           
          lts.ruleset
           msu_ru
             (
            ;; Some exceptions                  
              ( [ "*" ] = )


        но результат будет не очень, будет читать "один умножить два"

        По хорошему нужно добалять код в msu_ru_nsh_tokenizer.scm

        ExpandedWrap disabled
             ((string-matches name "РФ")
              (list "эр+эф"))
             ((string-matches name "\\*")
              (list "умножить" "на"))


        Тогда будет читать правильно "умножить на два"
          Цитата nsh @
          По хорошему нужно добалять код в msu_ru_nsh_tokenizer.scm

          ExpandedWrap disabled
               ((string-matches name "РФ")
                (list "эр+эф"))
               ((string-matches name "\\*")
                (list "умножить" "на"))


          Тогда будет читать правильно "умножить на два"

          nsh
          Спасибо, попробую!
            Здравствуйте.

            Скажите пожалуйста, а есть редакторы транскрипций кроме Wavesurfer? У меня не получается воспроизвести в нем звук

            ОС: Fedora Core 13


            Оффтоп: а есть какие ни будь речевые синтезаторы, которые проговаривают фразы по специально размеченным предложениям?
              Цитата
              Скажите пожалуйста, а есть редакторы транскрипций кроме Wavesurfer? У меня не получается воспроизвести в нем звук

              ОС: Fedora Core 13


              Загрузить модуль snd_pcm_oss (sudo modprobe snd_pcm_oss). Затем запускать wavesurfer через padsp

              padsp wavesurfer file.wav

              Цитата
              Оффтоп: а есть какие ни будь речевые синтезаторы, которые проговаривают фразы по специально размеченным предложениям?


              Festival, OpenMARY
                Оперативно :) спасибо

                Решил эту проблему по другому, просто раскоментировал в файле /etc/modprobe.d/dist-oss.conf строчку с загрузкой модуля все заработало

                Посмотрел OpenMARY - поддержки русского языка нет, и написана она на яве, ну в принципе какой вопрос такой и ответ :)

                Вопрос, а джаббер конференция у этого проекта есть?
                  Цитата
                  Посмотрел OpenMARY - поддержки русского языка нет, и написана она на яве, ну в принципе какой вопрос такой и ответ :)


                  Поддержка русского языка есть в ветке openmary-ru

                  Цитата
                  Вопрос, а джаббер конференция у этого проекта есть?


                  нет
                    а по какому принципу festival выбирает какую транскрипцию подставлять в каком-то конкретном случае? Например в ru_0001.wav диффоны (если не правильно поправьте) повторяются и точно такие же есть в других wav файлах

                    Цитата nsh @
                    Поддержка русского языка есть в ветке openmary-ru

                    будьте добры - ссылку, на офф сайте не нашел

                    P.S
                    сделал конференцию festival_tts@conference.jabber.ru там намного удобнее общаться, все таки real time :) Правда если гуру туда не пойдут смысла не будет от этой конфы

                    Добавлено
                    Цитата nsh @
                    Ну как из базы выбираются куски с учётом двух функций - target cost (соответствие куска тому, что нужно синтезировать) и join cost (соответствие куска соседним кускам, выбранным из базы). Потом всё склеивается и получается синтезированный звук.


                    нашел как это делается

                    А где посмотреть как он русские слова разбивает на транскрипции?
                      Цитата
                      а по какому принципу festival выбирает какую транскрипцию подставлять в каком-то конкретном случае? Например в ru_0001.wav диффоны (если не правильно поправьте) повторяются и точно такие же есть в других wav файлах



                      Транскрипция - текстовое представление звука, к выбору из базы она отношения не имеет. Тот кусок речи, который выбирается, называется элемент речи (unit). Среди всех элементов речи выбирается элемент с минимальной ценовой функцией, которая является суммой цены соответствия нужным характеристикой и цены соединения с уже выбранными элементами речи.

                      Цитата
                      будьте добры - ссылку, на офф сайте не нашел


                      Сейчас сайт http://mary.opendfki.de/ лежит, ветка соовтетствующая в subversion, в /branches. Не думаю, что трудно найти

                      Цитата
                      А где посмотреть как он русские слова разбивает на транскрипции?


                      На что разбивает? Транскрипция слова (его звуковое представление) получается из слова и словаря ударений. "разбивается" тут не применимо. Код, по слову определяющий транскрипцию находится в файле festvox/msu_ru_nsh_lexicon.scm.scm
                        Цитата nsh @
                        На что разбивает? Транскрипция слова (его звуковое представление) получается из слова и словаря ударений. "разбивается" тут не применимо. Код, по слову определяющий транскрипцию находится в файле festvox/msu_ru_nsh_lexicon.scm.scm

                        да, я не правильно выразился.

                        Если я, правильно понял то, слово(текст) разбивается на аллофоны, т.е. текстовое представление звука, правильно? Аллофоны лежат в msu_ru_nsh_clunits/lab/ru_*.lab

                        Можно ли как-то включить дебаг режим, чтоб видеть из каких файлов он берет эти куски речи, при составлении слова, чтоб можно было поправить в одном файле некоторые звуки? или хотя бы видеть из каких кусков речи состоит конкретное слово, чтоб поправить во всех файлах где эти элементы встречаются. Например слово "Офис" проговаривает как "Афис".
                          Цитата
                          Если я, правильно понял то, слово(текст) разбивается на аллофоны, т.е. текстовое представление звука, правильно?


                          Не разбивается, а преобразуется в последовательность аллофонов.

                          Цитата
                          Аллофоны лежат в msu_ru_nsh_clunits/lab/ru_*.lab


                          В файлах lab аллофоны не лежат, там лежит разметка базы на аллофоны.

                          Цитата
                          Можно ли как-то включить дебаг режим, чтоб видеть из каких файлов он берет эти куски речи, при составлении слова, чтоб можно было поправить в одном файле некоторые звуки?


                          Раскомментировать '(clunits_debug 1).

                          Цитата
                          Например слово "Офис" проговаривает как "Афис".


                          У Вас какая-то версия видимо очень старая. Попробуйте новую версию.
                            Цитата nsh @
                            Не разбивается, а преобразуется в последовательность аллофонов.
                            В файлах lab аллофоны не лежат, там лежит разметка базы на аллофоны.

                            ну мы поняли друг друга :)

                            Цитата nsh @
                            У Вас какая-то версия видимо очень старая. Попробуйте новую версию.

                            версия у меня последняя msu_ru_nsh_clunits-0.5.tar.bz2 скачивал от сюда
                              Цитата
                              версия у меня последняя msu_ru_nsh_clunits-0.5.tar.bz2 скачивал от сюда


                              Последняя версия находится здесь:

                              http://developer.berlios.de/svn/?group_id=3272
                                Цитата nsh @
                                Последняя версия находится здесь:

                                http://developer.berlios.de/svn/?group_id=3272

                                подскажите, а где тут русский голос лежит, в папке (root)/trunk/msu_ru_nsh_cg ?

                                Не могли бы написать небольшую инструкцию как его установить в festival.
                                1 пользователей читают эту тему (1 гостей и 0 скрытых пользователей)
                                0 пользователей:
                                Страницы: (19) « Первая ... 9 10 [11] 12 13 ...  18 19 все


                                Рейтинг@Mail.ru
                                [ Script execution time: 0,0462 ]   [ 14 queries used ]   [ Generated: 15.09.25, 19:27 GMT ]