На главную Наши проекты:
Журнал   ·   Discuz!ML   ·   Wiki   ·   DRKB   ·   Помощь проекту
ПРАВИЛА FAQ Помощь Участники Календарь Избранное RSS
msm.ru
Модераторы: RaD, nsh
Страницы: (19) « Первая ... 2 3 [4] 5 6 ...  18 19 все  ( Перейти к последнему сообщению )  
> Новая база для синтеза речи , и голос для festival
    Список предложений находится в архиве с голосом в файле etc/txt.done.data Это текстовый файл в кодировке UTF-8.
      Пересчитал базу кстати, поправил кучу ошибок и поддержку всяких возможностей, вроде автоопределение ё по словарю добавил. Новый пример:

      http://nshmyrev.narod.ru/temp/example_mod.wav

      Обновление:

      http://www.mediafire.com/?txmdn9ud2oj

      (распаковывается поверх старых данных)
        Ну треск и заикания понятно от чего. А чем объясняется довольно сильный металлический оттенок? Синтез же вроде компилятивный или нет?
          Знал бы исправил :) На самом деле там довольно примитивная склейка идёт с окном и скорее всего ещё куча ошибок в проге.

          Добавлено
          Хотя кстати немного металла в оригинальном голосе диктора есть, но, конечно, не на столько много.
            Цитата nsh @
            Обновление:

            http://www.mediafire.com/?txmdn9ud2oj

            (распаковывается поверх старых данных)

            Могу организовать постоянный сайт.
            Кидаешь в меня по почте, я оперативно выкладываю и отдаю ссылку.
              Посмотрел новую версию, в общем прогресс налицо.
              Самое заметное из улучшений:
              - стал читать союзы, раньше их пропускал.
              - отличает букву ё
              Не поправили:
              - Щелчки
              - Не равномерная скорость чтения, некоторые куски буквально тараторит, некоторые немного тянет
              - Не регулируется скорость и тембр голоса (если тембр не регулируется и бог с ним, то скорость я бы хотел поставить побольше)

              Пожелания:
              - Жаль что его нельзя включить параллельно со старой версией (только переименовывать папку), сравнивать трудно
              - Может всетаки сделать простенький сайт куда выкладывать новости о выходе версий
                Спасибо за замечания!

                Цитата

                - Не равномерная скорость чтения, некоторые куски буквально тараторит, некоторые немного тянет


                Пример текста приведите пожалуйста, я посмотрю, в чём там дело.

                Цитата
                Не регулируется скорость и тембр голоса (если тембр не регулируется и бог с ним, то скорость я бы хотел поставить побольше)


                Это важный недостаток используемого метода синтеза. Ведётся работа в этом направлении.

                Цитата

                - Может всетаки сделать простенький сайт куда выкладывать новости о выходе версий


                Сайт есть: http://developer.berlios.de/projects/festlang. Эта версия там не лежит, потому что она предварительная. Для вас, разработчиков так сказать.
                Сообщение отредактировано: nsh -
                  2nsh
                  Добрый день!
                  Хорошее дело задумали, но что-то в форуме мало сообщений.
                  Никому не интересно?

                  Поставил русский голос на FreeBSD 7.0.
                  И чудо! - работает :)

                  Повесил произношение на некоторые системные события (KDE).

                  Нашёл небольшой баг - при произношении фразы "Получена новая почта", слово "почта" произносится как бы из двух частей, и последняя часть с небольшим запаздыванием.

                  Вернее даже так "почаата"
                  Сообщение отредактировано: AlexVPetrov -
                    Спасибо, есть такая ошибка. Попробую её исправить и новую версию выложить в ближайшие дни.
                      Установил Фестиваль на Убунту. Запихнул словарь в /usr/share/estival/voice/ru

                      Получаю вот такую ошибку

                      festival> (voice_msu_ru_nsh_clunits) (tts_file "/home/mikhail/txt.done.data" ni
                      l)
                      msu_ru_nsh_clunits
                      LTS_Ruleset russian_downcase: no rule matches:
                      LTS_Ruleset: # *here* ( #
                      closing a file left open: /home/mikhail/txt.done.data
                      festival>

                      Файл не трогал. При вызове (SayText "файл") получаю фэйл.
                      Чуствую, что где то, что то не там лежит.
                      Сегодня ковырятся времени нет, буду завтра вечером, если подскажете что буду признателен.

                      Про фестивал первый раз прочитал час назад.
                        Цитата
                        (tts_file "/home/mikhail/txt.done.data" nil)


                        В файле что лежит-то? Попробуйте сначала текст без лишних знаков препинания и т.д. Только из букв в кодировке utf-8.

                        (tts_file "test.txt" nil)

                        Цитата
                        (SayText "файл") получаю фэйл.


                        Чего получаете, не понял?
                          С файлом я действительно намудрил, когда оставил одну фразу, все прочиталось.
                          Но когда вызываю (SayText "файл") он читает букву 'а' как 'э', типа на английском
                          Выглядит это так
                          festival> (SayText "файл")
                          pau f aa j l pau
                          #<Utterance 0xb77c5178>
                          festival>
                            Цитата
                            Но когда вызываю (SayText "файл") он читает букву 'а' как 'э', типа на английском


                            Хм, да, и такая ошибка тоже есть. Исправим в скором времени. Если ещё наткнётесь на не очень удачно читаемые слова - сообщайте пожалуйста.
                              Добрый день!
                              Скажите, что значит сделать разметку текста, и как это делается? Можно ли исправить ударения и произношения в некоторых словах, если можно то как это сделать (в каких файлах что исправить)?
                                Цитата
                                Скажите, что значит сделать разметку текста, и как это делается?


                                Скачиваете программу WaveSurfer, в файлах кладёте вместе wav файл и lab файл, открываете файл в wavesurfer. Выбираете режим транскрипции, исправляете границы и сохраняете. Новые lab файлы присылаете мне. Выглядит это так:

                                http://www.speech.kth.se/wavesurfer/man.html#tran

                                Цитата
                                Можно ли исправить ударения


                                Можно, слова нужно занести в словарь.

                                Цитата
                                и произношения в некоторых словах


                                С произношением сложнее, скорее всего произношение это проблемы разметки, но нужно смотреть в каждом конкретном случае отдельно. Какие слова или, точнее, фразы произносятся неверно? Надо бы составить список в десяток фраз, потом можно будет им заняться. Пока у нас в списке только "файл".
                                0 пользователей читают эту тему (0 гостей и 0 скрытых пользователей)
                                0 пользователей:
                                Страницы: (19) « Первая ... 2 3 [4] 5 6 ...  18 19 все


                                Рейтинг@Mail.ru
                                [ Script execution time: 0,0328 ]   [ 15 queries used ]   [ Generated: 22.12.24, 05:16 GMT ]