На главную Наши проекты:
Журнал   ·   Discuz!ML   ·   Wiki   ·   DRKB   ·   Помощь проекту
ПРАВИЛА FAQ Помощь Участники Календарь Избранное RSS
msm.ru
Модераторы: RaD, nsh
Страницы: (19) « Первая ... 5 6 [7] 8 9 ...  18 19 все  ( Перейти к последнему сообщению )  
> Новая база для синтеза речи , и голос для festival
    echo "Привет Родина" | text2wave -eval '(voice_msu_ru_nsh_clunits)' | aplay
    Сообщение отредактировано: nsh -
      nsh, спасибо за ответ. есть еще вопрос:

      storm@storm:~$ echo "Привет Родина" | text2wave -eval '(voice_msu_ru_nsh_clunits)' | aplay
      pau p rr i vv ee t r oo dd ae n a pau

      Playing WAVE 'stdin' : Signed 16 bit Little Endian, Rate 16000 Hz, Mono

      Сказало очень чисто. Все гуд. После введения второй фразы с клавиатуры:

      storm@storm:~$ echo "Доброе утро" | text2wave -eval '(voice_msu_ru_nsh_clunits)' | aplay
      pau d oo b r ay j e uu t r a pau
      Playing raw data 'stdin' : Unsigned 8 bit, Rate 8000 Hz, Mono

      шипение и ни звука.

      Чтобы это могло значить?
        Ну aplay глючит, можно попробовать:

        ExpandedWrap disabled
          echo "Доброе утро" | /home/shmyrev/work/voice/festival/bin/text2wave -eval '(voice_msu_ru_nsh_clunits)' | aplay -f S16_LE -r 16000
          nsh, огромное спасибо за совет. все гуд :).

          были ли пробы заставить операционку говорить? у меня линукс. вот хочу попробовать сделать так, чтобы он здоровался :) (хотябы для начала)
            по непонятным причинам при вводе:

            storm@storm:~$ echo “Astala vista baby”| festival --tts


            после произношения всей фразы, начал повторять три первых буквы :(....

            И еще...какая команда тестирует дату и время и озвучивает их?
            Сообщение отредактировано: DrStorm -
              Ну бывают ошибки. В принципе можно стараться их исправлять. По поводу "научиться говорить", это уже многие приложения делают. Emacspeak, Orca и ещё не счесть

              http://linux.tiflocomp.ru/docs/orca-festival-ru.php
                ;) я вкурсе что есть оrka, есть еще и gnome-voice-control. А вы слышали как орка говорит английские слова, если на них попадает в менюшке например :D . Интересуют более солидные вещи. Работали ли вы с Sphinx4? Вот пробую разобраться с распознаванием русской речи и написанием (составлением) словаря.
                  Цитата nsh @
                  Вобщем-то так и сделано, сейчас используется словарь на 180000 слов.

                  А его по лицензии GPL можно как-то получить?
                    Цитата
                    А его по лицензии GPL можно как-то получить?


                    словарь ударений и частей речи находится в архиве с голосом в файле dict/msu_ru_nsh_dict.scm. Он был сделан с помощью программы synan с сайта http://aot.ru
                      Есть предложение собрать воедино все символы и комбинации символов, которые festival пока не распознает.
                      ----->
                      festival не распознает следующие 4 символа:
                      Цитата
                      «»/:
                      ----->
                      Не работает на 2ух сочетаниях:
                      Цитата
                      ?*.
                      где * - один и более пробелов. Причем на "?." работает.
                      Цитата
                      .*
                      где * - любой символ кроме пробела. Т.е.:
                      Цитата
                      q4a1@q4a ~/festival/bin
                      $ cat test1.txt
                      123.
                      q4a1@q4a ~/festival/bin
                      $ ./text2wave -eval '(voice_msu_ru_nsh_clunits)' test1.txt -o test1.wav
                      pau s t oo d v aa c a tt t rr ii pau
                      Duration tree extreme for ii 3.21155


                      q4a1@q4a ~/festival/bin
                      $ cat test2.txt
                      123.r
                      q4a1@q4a ~/festival/bin
                      $ ./text2wave -eval '(voice_msu_ru_nsh_clunits)' test2.txt -o test2.wav
                      LTS_Ruleset russian_downcase: no rule matches:
                      LTS_Ruleset: # 1 2 3 *here* . r #

                      q4a1@q4a ~/festival/bin
                      $ cat test3.txt
                      .u
                      q4a1@q4a ~/festival/bin
                      $ ./text2wave -eval '(voice_msu_ru_nsh_clunits)' test3.txt -o test3.wav
                      LTS_Ruleset russian_downcase: no rule matches:
                      LTS_Ruleset: # *here* . u #
                      Сообщение отредактировано: it4q4a -
                        Мне легче сказать вам, какие символы распознаются:

                        Буквы:

                        A-z, А-я,

                        символы:

                        - ' + ? ! . , (+ специально используется для расстановки ударений)

                        цифры:

                        0-9

                        Остальные нужно вырезать.
                        Сообщение отредактировано: nsh -
                          Цитата nsh @
                          - ' + ? ! . , (+ специально используется для расстановки ударений)
                          Ещё работает ';' =)
                          Хочу для начала 1-2 книжки руками поправить, а потом скриптик написать, заменяющий все непонятные для festival символы на пробелы.
                          Сообщение отредактировано: it4q4a -
                            Я решил эту проблему добавив фильтры в kttsmgr
                            И попробовал слушать книжку после этого.
                            Стали вылазить странные глюки.
                            Отдельные слова читаются нормально, а вот именно в таком сочетании глючит.
                            Хотя это все конечно встречается редко.
                            И этим страдают и релизы коммерческих голосов.
                              to nsh

                              Здравствуйте!
                              У меня к вам такой вопрос! Я хочу использовать festival как сервер. Запускаю фестиваль такой командой ./festival --server '(begin(voice_msu_ru_nsh_clunits))'. Фестиваль загружается и работает как сервер. Я написал программу клиент которая коннектится к этому серверу и передает ему команду в виде текстовой строки на воспроизведение речи. команда(текстовая сторка) такая: (SayText "привет. я Фестиваль и так далее") (audio_mode async)". Строка воспроизводится, но проблема в том что очень большая задержка перед воспроизведение речи (около 10-15 секунд). Если я посылаю на воспроизведение несколько фраз подряд, то задержка может доходить до минуты и больше. Скажите как мне сделать задержку перед выводом речи (в серверном приложении фестиваля) минимальной?
                                Сервер использовать помощнее, для нескольких запросов - несколько серверов. Кэшировать результат. Фразы посылать короткие, а не весь текст сразу. Как вариант можно переписать приложение на C для ускорения производительности.
                                1 пользователей читают эту тему (1 гостей и 0 скрытых пользователей)
                                0 пользователей:
                                Страницы: (19) « Первая ... 5 6 [7] 8 9 ...  18 19 все


                                Рейтинг@Mail.ru
                                [ Script execution time: 0,0395 ]   [ 14 queries used ]   [ Generated: 15.09.25, 19:27 GMT ]