На главную Наши проекты:
Журнал   ·   Discuz!ML   ·   Wiki   ·   DRKB   ·   Помощь проекту
ПРАВИЛА FAQ Помощь Участники Календарь Избранное RSS
msm.ru
Модераторы: RaD, nsh
Страницы: (23) 1 [2] 3 4 ...  22 23  ( Перейти к последнему сообщению )  
> Работа с CMU Sphinx , Работа с CMU Sphinx 4.0
    Цитата
    zamirваша база не заработала - все та же ошибка выскакивает - ArrayIndexOutOfBoundsException.


    Эта ошибка выскакивает, потому что Вы не ознакомились с документацией:

    http://cmusphinx.sourceforge.net/sphinx4/doc/UsingSphinxTrainModels.html
      Цитата
      Здравствуйте! Я пробовал использовать вашу языковую модель со sphinx 4 - у меня не очень получилось (ошибка при загрузке). При этом модель с voxforge http://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/Voxforge%20Russian/ мне использовать удалось (применял в примере HelloNGram). Можно ли использовать вашу модель со sphinx 4? Если нет, то где ее можно использовать? Если тут ее использовать можно, то я могу написать issue с деталями ошибки.
      Спасибо!


      Цитата
      Добрый день. Посетите пожалуйста вот эту ссылку Работа с CMU Sphinx
      собственно там обсуждались эта проблема.
      Ответ разработчика (nsh) был таков:
      Эта ошибка выскакивает, потому что Вы не ознакомились с документацией:
      http://cmusphinx.sourceforge.net/sphinx4/doc/UsingSphinxTrainModels.html

      Поясню. У меня модель 8кГц. На voxforge две модели 8кГц и 16кГц.
      Настройки по умочанию годятся для модели 16кГц. Для 8 кГц надо исправить как написано по ссылке. Дальнейшее обсуждение лучше производить на форуме forum.sources.ru в указанной теме.


      Цитата
      Спасибо, все заработало!


      Ну вот, всё что надо для того чтобы модель заработа в java тут написано :)
        zamir
        Добрый день. Подскажите пожалуйста. Вчера прочитал все ветки про распознавание речи и конкретно про sphinx. Кое-что начинает проясняться. Я так понял, что "готовая псевдоморфологическая модель" ссылку на которую вы давали в другой теме есть языковая модель и словарь одновременно? А акустические модели можно взять здесь: http://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/. То есть взяв всё это и правильно прикрутив можно начать распознавать речь?
          Добрый день


          здесь: http://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/
          языковая и акустическая модель Николая (nsh)

          здесь: https://github.com/zamiron/ru4sphinx
          мои языковая и акустическая модуль (zamir)

          в обоих языковых моделях мофрологии нет (поэтому у меня она очень большая)
          можно взять ту или иную модель и распознавать текст
          я конечно же рекомендую свои модели и pocketsphinx :)
          А ещё лучше если вы сделаете сравнения моделей на словах которые есть в словаре nsh (в моей модели эти все слова наверника тоже есть)
            Тогда можно еще пояснить. Для программного распознавания речи нужны: 1 - акустическая модель(для превращения звуков в фонемы), 2 - словарь(для превращения фонем в слова), 3 - языковая модель(для превращения слов в предложения). Всё это можно взять по двум выше приведённым ссылкам (либо по одной из них)?
              да. всё верно.
                zamir
                Спасибо большое.
                  Здравствуйте. Если Pocketsphinx это С, то я так понял С++ Builder тоже подойдёт?
                    Николай вроде писал что нужен Visual Studio
                    там вроде даже есть файлы для сборки
                    Цитата
                    pocketsphinx.sln 10812 4 months nshmyrev Update VS project files to VS 2010

                    при большом желании наверное и под что-то другое можно адаптировать
                      Ребята, как запускать sphinx4 или pocketsphinx под Windows?
                      Прошу снисхождения к чайнику, сам не смог допереть. Установил Java SDK и JDK , установил лицензию файлом jsapi.exe, а дальше не пойму, что делать.
                      Заранее благодарю
                        Сразу скажу что под windows не пробовал pocketsphinx, но по официальной информации sphinxbase и pocketsphinx компилятся под windows с помощью VS 2008. Сборочные файлы для Visual Studio лежат в этих архивах. Соответсвенно сначала надо собраться sphinxbase а затем pocketsphinx

                        http://cmusphinx.sourceforge.net/wiki/tuturialpocketsphinx

                        Цитата
                        Windows

                        In MS Windows ™, under MS Visual Studio 2008 (or newer - we test with Visual C++ 2008 Express):

                        * load sphinxbase.sln located in sphinxbase directory
                        * compile all the projects in SphinxBase (from sphinxbase.sln)
                        * load pocketsphinx.sln in pocketsphinx directory
                        * compile all the projects in PocketSphinx

                        MS Visual Studio will build the executables under .\bin\Release or .\bin\Debug (depending on the version you choose on MS Visual Studio), and the libraries under .\lib\Release or .\lib\Build. To run pocketsphinx_continuous, don't forget to copy sphinxbase.dll to the bin folder. Otherwise the executable will fail to find this library.
                          теперь знач по винде: с учетом тех ручных правок мейкфила для винды, которыя я делал 3 мес назад и поэтому не оч помню, собрата была под виндой либа сфинха базогая.
                          с этой либой покет , который кстать под виндой собралсо слету без 1 ошибки, живое распознавание делол легко но, ***ь, в утф8 которые под виндой **й прочтеж ))))))))))))))))))))
                          линуховый ж лив покет распознавал ваще мимо техта. т.е. койкакоето созвучие было но не 96 % .

                          дык може я мордель не тую прицыпил?

                          теперя 2я вопрос , который еще важнее:
                          каковым образом делается самая первичнейщая маркировка вавов?????
                          т.е. допустим есь цму_ххх_арктик и там обязательно для каждого ххх есть директория лаб. в ней метки, определяющие, почему-то конец буквы - это я вручную проверил, овродя бы сходитсо. ок. там сказато - автолабелинг.
                          открываю сфинх_алигн - там уже какая то модель заложена.
                          по некоторым сведениям модель та делаетса в 2 этапа: сначала некая приблизительная, потом с помощью ее автомаркировка и потом уже окончательная. ок, но как же делаетсо то эта самая приблизительная маркировка? т.е. вот мы создали новые, фонемы, АА, АЫ, АЭ, УУ, ББ, ну и тп, неважно, и как же оно 1й раз понимает, где там что? неужели "натягивает" транскрипцию с учетом словаря и модели языка на тестовые фразы в вавах???
                          или же поначалу нужна ручная разметко???
                            Цитата
                            в утф8 которые под виндой

                            перекодируйте фонетический словарь и языковую модель и наступит счастие под windows

                            Цитата
                            неужели "натягивает" транскрипцию с учетом словаря и модели языка на тестовые фразы в вавах???

                            да и достаточно успешно. поэтому для успешной разметки длина звукового файла не должна быть очень большой.
                              Цитата zamir @
                              перекодируйте фонетический словарь и языковую модель и наступит счастие под windows

                              здорово но непонятно где именно и каким образом учитывается утф внутри самих прог, составляющих сфинх. там же в утф переменная длина символа - вот шо самое поганое
                                ничего изобретать не нужно
                                iconv и sphinx_lm_convert решают эту задачу
                                0 пользователей читают эту тему (0 гостей и 0 скрытых пользователей)
                                0 пользователей:
                                Страницы: (23) 1 [2] 3 4 ...  22 23


                                Рейтинг@Mail.ru
                                [ Script execution time: 0,3076 ]   [ 16 queries used ]   [ Generated: 19.03.24, 02:24 GMT ]