На главную Наши проекты:
Журнал   ·   Discuz!ML   ·   Wiki   ·   DRKB   ·   Помощь проекту
ПРАВИЛА FAQ Помощь Участники Календарь Избранное RSS
msm.ru
Модераторы: RaD, nsh
Страницы: (19) « Первая ... 6 7 [8] 9 10 ...  18 19 все  ( Перейти к последнему сообщению )  
> Новая база для синтеза речи , и голос для festival
    to nsh

    скажите а где можно узнать про все опции которые которые понимает фестиваль при получении текста! например, можно написать: "на агрег+ате" - что в данном случае означает символ "+"? наверняка есть еще специальные символы! напрмер запятая распознается как пауза после слова, и если слова в фразе перечислять через запяту то они звучат по другому нежели без запятых! где можно узнать про все такие символы и их значение?
      + ставит ударение

      Больше символов никаких нет, текст системой обрабатывается автоматически, поэтому иногда запятая воспринимается, как пауза, а иногда синтезатор решает читать без паузы. Звучание зависит от многих параметров - интонации, положения в слове, расстояния до запятых и так далее. Зависимость эта сложная, поэтому придётся полагаться на синтезатор.
        спасибо
          nsh, насколько актуальна разметка на http://www.dev.voxforge.org/projects/Russian/browser/Trunk/Audio/Original/16kHz_16bit/, есть ли смысл размечать вручную или есть какие-нибудь другие решения?
            Разметка тут - http://www.dev.voxforge.org/projects/Russian/browser/Trunk/Audio/Original/16kHz_16bit/urp последнияя версия. Размечать вручную смысл есть, конечно, но если есть желание серьёзно заниматься этим, нужно сначала подумать немного, как бы к делу приступить.

            Добавлено
            Проблема в том там, что диктор делал слишком много пауз, что негативно сказывается на качестве синтеза. Простой разметкой тут не поможешь. Нужно сначала в автоматической разметке нужно учесть этот фактор и сделать специальный звук для оконечной гласной либо надо базу заново перезаписывать.
              что значит сделать звук для оконечной гласной?
              Как мне показалось, основная проблема плохой речи, это именно размета, т.к. некоторые звуки в некоторых предложениях неправильно размечены, т.е. слишком короткие, поэтому идет заикание и проглатывание.
              А как влияют паузы я не заметил.

              А чем делалась автоматическая разметка? Нельзя ли доработать программу, чтобы она нормально автоматическую разметку делала?
              Сообщение отредактировано: ETY82 -
                Цитата
                Как мне показалось, основная проблема плохой речи, это именно размета, т.к. некоторые звуки в некоторых предложениях неправильно размечены, т.е. слишком короткие, поэтому идет заикание и проглатывание.
                А как влияют паузы я не заметил.


                Короткие звуки - скорее признак, а не причина. Причину я выше написал.

                Цитата
                А чем делалась автоматическая разметка? Нельзя ли доработать программу, чтобы она нормально автоматическую разметку делала?


                Можно доработать, ссылку на статьи с методами я давал в одном из тредов:

                Вопрос по HTK
                  привет, я тут новичок, кто подскажет какая хорошая софтина для конвертации речи в текст и где ее можно скачать???

                  заранее спасибо
                    Вышел новый выпуск!

                    Из изменений

                    1. Интегрированы обновления с буквой ё, теперь не надо докачивать архив
                    2. Пересчитана разметка с помощью более точных моделей, на мой взгляд, голос стал плавнее

                    Впереди новые выпуски, тестируйте, пишите об ошибках, присоединяйтесь.

                    http://download.berlios.de/festlang/msu_ru_nsh_clunits-0.5.tar.bz2
                    Сообщение отредактировано: nsh -
                      nsh, я тут изобразил spec-файл для сборки rpm под suse. Если в нем поменяете определения main_dir и doc_dir, сможете собрать и под другие rpm-based дистрибутивы. Сборку для suse могу закачать, куда скажете, если пожелаете.

                      festival-msu_ru_nsh_clunits.spec
                      ExpandedWrap disabled
                        %define name        festival-msu_ru_nsh_clunits
                        %define version     0.5
                        %define release     1
                        %define main_dir    usr/share/festival/voices/russian/msu_ru_nsh_clunits
                        %define doc_dir     usr/share/doc/packages/%{name}
                         
                        Summary: Russian voice for the Festival
                        Name: %{name}
                        Version: %{version}
                        Release: %{release}
                        License: GPL
                        Group: Productivity/Text/Convertors
                        BuildArch: noarch
                        BuildRoot: %{_builddir}/%{name}-root
                        URL: http://festlang.berlios.de/docu/doku.php?id=russian
                        Source: http://download.berlios.de/festlang/msu_ru_nsh_clunits-%{version}.tar.bz2
                        Distribution: openSuSE
                        Vendor: Nickolay V. Shmyrev <nshmyrev@yandex.ru>
                        Packager: Alexander Kurin <alexander.kurin@gmail.com>
                        Provides: festival-msu_ru_nsh_clunits
                        Requires: festival >= 1.96
                         
                        %description
                        Russian voice msu_ru_nsh_clunits for the Festival Speech Synthesis System.
                         
                         
                        %prep
                        exit 0
                         
                        %build
                        mkdir -p %{buildroot}/%{main_dir}
                        tar --directory=%{buildroot}/%{main_dir}/.. -xjf \
                            %{_sourcedir}/%{name}/msu_ru_nsh_clunits-%{version}.tar.bz2
                        mkdir -p %{buildroot}/%{doc_dir}
                        mv %{buildroot}/%{main_dir}/{README,COPYING} %{buildroot}/%{doc_dir}
                        exit 0
                         
                        %install
                        exit 0
                         
                        %clean
                        exit 0
                         
                        %files
                        %defattr(-,root,root,0755)
                        %doc /%{doc_dir}/README
                        %doc /%{doc_dir}/COPYING
                        %dir /%{doc_dir}
                        /%{main_dir}/..

                      В конце файла должен быть возврат каретки, движок форума почему-то его вырезает.
                      Сообщение отредактировано: 19th -
                        Цитата
                        nsh, я тут изобразил spec-файл для сборки rpm под suse. Если в нем поменяете определения main_dir и doc_dir, сможете собрать и под другие rpm-based дистрибутивы. Сборку для suse могу закачать, куда скажете, если пожелаете.


                        Спасибо большое. А сборку, я думаю, нужно в дистрибутив закачивать:

                        http://en.opensuse.org/Build_Service
                          Выложил здесь: http://download.opensuse.org/repositories/home:/19th/
                            Немножко потестировал систему. Чтобы было не так скучно, написал скрипт на perlе, который читает на сайте anecdot.ru анекдот и его оценку, если оценка достаточно большая, то анекдот скармливается festival серверу. Пока пару субъективных впечатлений:
                            а) очень не хватает нормального словаря с буквой ё. Одно только это улучшило бы впечатление в разы.
                            б) похоже, есть проблемы с ударением для слов не в именительном падеже?
                            в) Вообще много проблем с ударениями.

                            Интересно, что слово "рука" в базе данных помечено вполне правильно, с ударением на 2-й слог, однако
                            (SayText "Рука руку моет")
                            говорит рУка. Довольно простое слово, чтобы ошибаться;)
                              Цитата
                              а) очень не хватает нормального словаря с буквой ё. Одно только это улучшило бы впечатление в разы.


                              Словарь там нормальный, для всех вариантов с ё должен работать. Какое слово не читается?

                              Цитата
                              б) похоже, есть проблемы с ударением для слов не в именительном падеже?
                              в) Вообще много проблем с ударениями.


                              Словарь ударений нужно расширить. Для этого нужно обработать словарь Зализняка с aot.ru, вычленить оттуда часть речи и ударный слог. Если интересно, займитесь этим.

                              Цитата
                              Интересно, что слово "рука" в базе данных помечено вполне правильно, с ударением на 2-й слог, однако
                              (SayText "Рука руку моет")
                              говорит рУка. Довольно простое слово, чтобы ошибаться;)


                              Это ошибка в разметке базы, в следующем выпуске подправим. Спасибо за тестирование.
                              Сообщение отредактировано: nsh -
                                Цитата nsh @
                                Словарь там нормальный, для всех вариантов с ё должен работать. Какое слово не читается?

                                Цитата

                                Практически не встречал слов с ё, которые бы читались правильно.
                                Примеры:

                                допьешься
                                Жигуленок
                                сомкнет
                                трех-четырех

                                В словаре, вроде, буква ё встречается в основном в фамилиях. Скачал пару баз ёфикации, попробую применить к словарю.

                                Кстати, кdict/msu_ru_nsh_stress.tree каким-либо образом генерируется из словаря или это абсолютно самостоятельная боевая единица?
                                1 пользователей читают эту тему (1 гостей и 0 скрытых пользователей)
                                0 пользователей:
                                Страницы: (19) « Первая ... 6 7 [8] 9 10 ...  18 19 все


                                Рейтинг@Mail.ru
                                [ Script execution time: 0,0377 ]   [ 14 queries used ]   [ Generated: 15.09.25, 21:22 GMT ]