На главную Наши проекты:
Журнал   ·   Discuz!ML   ·   Wiki   ·   DRKB   ·   Помощь проекту
ПРАВИЛА FAQ Помощь Участники Календарь Избранное RSS
msm.ru
Модераторы: RaD, nsh
Страницы: (23) « Первая ... 11 12 [13] 14 15 ...  22 23  ( Перейти к последнему сообщению )  
> Работа с CMU Sphinx , Работа с CMU Sphinx 4.0
    Обновил maven до apache-maven-3.2.2. Скачал последний sphinx4-master c https://github.com/cmusphinx/sphinx4. JAVA Version 7 Update 67, os WinXP sp3. Собираю в NetBeans 8.0, выдает сообщение об ошибке (полный журнал сборки слишком длинный, по этому заливаю его в текстовый файл):
    Прикреплённый файлПрикреплённый файлnetbeans_error_message.rar (18,82 Кбайт, скачиваний: 137)
      Не нужно было простыни вставлять в сообщение, их лучше прикреплять во вложении.

      Ошибку с javadoc я тоже поправил вчера. Обновитесь им попробуйте еще раз.

      Пишите, если будут проблемы.
        Выдало несколько ошибок, но в конце написало:

        Reactor Summary:

        Sphinx4 ........................................... SUCCESS [1.870s]
        Sphinx4 models .................................... SUCCESS [9.001s]
        Sphinx4 core ...................................... SUCCESS [36.926s]
        Sphinx4 demo applications ......................... SUCCESS [8.781s]
        ------------------------------------------------------------------------
        BUILD SUCCESS

        я так понимаю, что собралось. Как мне теперь запустить пример "dialog"? Так понимаю, он входит в состав свежесобранного проекта "Sphinx4 demo applications". Открыл в NetBeans "Sphinx4-samples", я так понял, в его состав входят все 4 примера, включая и диалог. Как запустить нужный? При выполнении run на "Sphinx4 demo applications" выдает ошибку (залито в файл):
        Прикреплённый файлПрикреплённый файлerror_Sphinx4_demo_applications.rar (2,59 Кбайт, скачиваний: 166)
          Ну микрофон у Вас 16кГц не поддерживает. Не знаю тут, что Вам посоветовать, драйвер микрофона обновите, что-ли.
            учту, спасибо
              nsh, zamir
              Здравствуйте! Не могли бы Вы немного просветить новичка по поводу фонетических словарей (.dic)? В сфинкс-вики написано, что "наивный" подход транскрибирования (просто отобразить каждую букву слова на соответствующую латинскую) в итоге дает хорошие результаты. Справедливо ли это для русского/украинского языков?

              Я пытаюсь сделать фонетический .dic-словарь для украинского языка, а ./dict2transcript.pl формирует немного неправильные транскрипции для украинских слов (я понимаю, что скрипт для русского языка, но языки ведь похожи вроде как, попытка не пытка :D ). Так вот, сработает ли в моем случае "наивный" подход? Я почему так надеюсь на это упрощение - у меня нет таких глубоких лингвистических знаний, а глядя на работу, вложенную в ./dict2transcript.pl меня кидает в жар :no-sad:

              Заранее огромное спасибо откликнувшимся! :)
              Сообщение отредактировано: i7achi -
                Цитата
                В сфинкс-вики написано, что "наивный" подход транскрибирования (просто отобразить каждую букву слова на соответствующую латинскую) в итоге дает хорошие результаты.

                Этот подход работает, но даёт не такой хороший результат. По идеи так должно быть написано.

                Цитата
                У меня нет таких глубоких лингвистических знаний.

                У меня тоже небыло, когда составлял dict2transcript.pl
                Много информации было найдено в интернет (когда ознакамливался вспомнил, что многое нам преподавали ещё в школе, в мадших классах). По Украинскому наверняка это информации меньше, но она всречалась мне так-же.
                Сначала по книжкам, потом можно собственные наработки вставлять.
                Увидите что что-то не так распознаётся. Подумаете над фонетическим составом - внесёте исправления в транскриптор.
                Вам главное начать - и всё получиться.
                  zamir
                  Спасибо за Ваш ответ! Попробую для начала сделать элементарные преобразования, а потом уже, глядя на результаты распознавания, буду вносить поправки в транскриптор. Да и в украинском языке в основном прямолинейное произношение - "как пишу так и говорю" :)
                  Отельное спасибо Вам за транскриптор - нашел в нем замечательные конструкции, которые мне помогут в составлении своего :good:

                  P.s. В ./dict2transcript.pl еще есть много кода, связанного с ударениями. Их вообще нужно проставлять в .dic словаре в каждом слове при помощи '+' ? Просто в msu_ru_nsh.dic и в английских словарях почти нет слов с проставленными ударениями и все распознается нормально :huh:
                  Сообщение отредактировано: i7achi -
                    Цитата
                    P.s. В ./dict2transcript.pl еще есть много кода, связанного с ударениями. Их вообще нужно проставлять в .dic словаре в каждом слове при помощи '+' ? Просто в msu_ru_nsh.dic и в английских словарях почти нет слов с проставленными ударениями и все распознается нормально

                    В словарях для sphinx нет знака "+"
                    Знак "+" есть в спомогательном словаре ударений.
                    Дело в том что фонемный состав в русском языке зависит от ударения.
                    Поэтому что бы сгенерить фонетический словарь sphinx нужно знать ударение для каждого слова и соответсвенно использовать словарь ударений.
                    Сообщение отредактировано: zamir -
                      Цитата
                      В словарях для sphinx нет знака "+"

                      Хмм... А что же тогда в начале у msu_ru_nsh.dic ?
                      Цитата
                      +издали ii z d ay ll i
                      +окна oo k n a
                      +острова oo s t r ay v a
                      +эн ee n
                      +эрц ee r c

                      И дальше встречаются такие же конструкции. Это получается по ошибке туда пробрались плюсики?
                        да нет
                        это Николай для контроля ударение в словаре проставил
                        "Издали, издАли" - в зависимости от ударения два разных слова получаются
                        можно записать так:
                        издали ii z d ay ll i
                        издали(2) i z d aa ll i
                        издали(3) yy z d ay ll i
                          Цитата
                          можно записать так:
                          издали ii z d ay ll i
                          издали(2) i z d aa ll i
                          издали(3) yy z d ay ll i

                          Это получается ударение на удвоенной гласной?
                          В первом случае - ii
                          втором - аа
                          третьем - yy

                          Так ведь?
                            Цитата
                            Это получается ударение на удвоенной гласной?
                            В первом случае - ii
                            втором - аа
                            третьем - yy


                            Не удвоенные гласные а ударные. ii, aa, yy, ee, oo - ударные. a, e, i - первая степень редукции. ay, ae - вторая степень редукции.
                              nsh
                              Спасибо, теперь стало намного понятнее! :thanks: Пойду работать дальше)
                                Здравсвуйте.
                                Не хотел создавать новую тему. Решил спросить здесь.
                                Возникла проблема при создании файла словаря для pocketsphinx.
                                Скачал text2dic в нем есть текствовые файлы и perl скрипты.
                                Запускаю так:
                                ExpandedWrap disabled
                                  perl dict2transcript.pl myword.txt mydic.dic

                                а выходит пустой файл.
                                Что я делаю не так?
                                1 пользователей читают эту тему (1 гостей и 0 скрытых пользователей)
                                0 пользователей:
                                Страницы: (23) « Первая ... 11 12 [13] 14 15 ...  22 23


                                Рейтинг@Mail.ru
                                [ Script execution time: 0,0409 ]   [ 18 queries used ]   [ Generated: 18.07.25, 10:26 GMT ]