На главную Наши проекты:
Журнал   ·   Discuz!ML   ·   Wiki   ·   DRKB   ·   Помощь проекту
ПРАВИЛА FAQ Помощь Участники Календарь Избранное RSS
msm.ru
Модераторы: RaD, nsh
Страницы: (23) « Первая ... 14 15 [16] 17 18 ...  22 23  ( Перейти к последнему сообщению )  
> Работа с CMU Sphinx , Работа с CMU Sphinx 4.0
    Цитата
    5. Если не получится, то мое внимание приковывает Сфинкс,какие у него ограничения по распознаванию речи- хотя бы 20 тысяч слов потянет?


    Потянет

    Цитата
    6.Есть ли c#-обертки под pocketsphinks? Насколько я понял, необходимо сделать обертку,которая вызывает Си-шные библиотеки pocketsphinx-а?Через invoke,вроде.


    Это не сложно

    Цитата
    7. pocketsphinx- диктороНЕзависимый?


    Да
      Не нашел подробной информации по такому вопросу:

      Может ли CMU Sphinx работать в качестве сервиса? В таком случае, к нему могли бы подключаться клиенты, написанные на любом языке.

      Если да- можно ссылку на подробности?

      Спасибо.
        Может, например, вот тут есть на node сервис:

        https://github.com/cmusphinx/node-pocketsphinx

        вот тут на ruby:

        https://github.com/alumae/ruby-pocketsphinx-server
          Добрый вечер.
          Только начинаю использовать cmu-sphinx, скачала версию pre-alpha5. Демо работают нормально, а вот при использовании русской модели из их репозитория возникла странная проблема.
          Использую LiveSpeechRecognizer.
          В момент, когда начинаю распознавание, всё зависает, минут через 10 вылезает GC overhead limit exceeded.
          Может кто-то сталкивался?
          Внятных рекомендаций найти не могу. Увеличить размер памяти для jvm не помогло.
          Если это важно, использую os x, sdk java 8.
            Русская модель очень большая, чтобы её использовать нужно много памяти, которую можно выделить с помощью параметра java -Xmx, например -Xmx4096m

            Для более быстрого декодирования с русской моделью можно использовать pocketsphinx.
              Цитата
              Однако во время исполнения NetBeans выдает ошибку
              Цитата
              java.lang.ArrayIndexOutOfBoundsException: 29
              at edu.cmu.sphinx.linguist.acoustic.tiedstate.MixtureComponent.getScore(MixtureComponent.java:195)
              at edu.cmu.sphinx.linguist.acoustic.tiedstate.GaussianMixture.calculateScore(Gaussian


              Здравствуйте, у меня такая же ошибка, видел что отправляют читать мануал, читал не нашел как исправить.
              Получилось так, испытывал приложение HelloWorld со словарем zero_ru_cont_8k_v3, но т.к. мне все слова
              заведенные в файл ru.dic не нужны, решил уменьшить, вероятно сделал это неправильно, но теперь
              программа выдает эту ошибку.
              Пишу под jawa работаю в Netbeans.
              Пожалуйста не судите строго за сумбурное изложение, помогите разобраться.
                Цитата
                Пожалуйста не судите строго за сумбурное изложение, помогите разобраться.


                Как разбираться-то, если Вы не удосужились никакой информации предоставить? Телепатов среди нас нет. Проект нужно выложить, или хотя бы описать его структуру, код показать.
                  Спасибо за быстрый ответ,
                  файлы проекта и настроек прикрепил
                  Прикреплённый файлПрикреплённый файлprbsphinx.zip (3,11 Кбайт, скачиваний: 157)
                    Дополню вопрос,
                    Используется pocketshinx4, zero_ru.cd_cont_4000.
                    Качество и скорость распознавания вполне устраивают.
                    Но все таки хотелось бы увеличить скорость. На что стоит сделать упор, на процессоре или на памяти, что является бутылочным горлышком?
                    Сейчас схема работает в тестовом режиме, т.е. массовости распознавания нет, речь идет пока только про тестовый контур.
                      Цитата SAndrusReg @
                      файлы проекта и настроек прикрепил


                      Вы используете устаревшую версию sphinx4. Для наилучшего распознавания используйте последнюю версию sphinx4-5prealpha, как описано в руководстве

                      http://cmusphinx.sourceforge.net/wiki/tutorialsphinx4

                      Добавлено
                      Цитата Zusrut @
                      отсюда вопрос как запустить сфинкса в режиме ожидания - чтобы он держал все параметры загруженными и только ждал когда ему подкинут wav файлик?


                      Использовать программный интерфейс pocketsphinx, например, на python:

                      https://github.com/cmusphinx/pocketsphinx/b...decoder_test.py

                      Добавлено
                      Цитата AlexeyMish @
                      На что стоит сделать упор, на процессоре или на памяти, что является бутылочным горлышком?


                      Вообще ptm модели гораздо быстрее, чем cont. Если нужна производительность лучше использовать их.

                      На заданный вопрос лучше всего ответит профиль системы, собрать его можно с помощью oprofile/operf.
                        Спасибо, вообще-то я был уверен что использую эту версию. Сейчас все проверю.
                          Добрый день!
                          Как лучше всего будет реализовать массовое распознавание речи на разных языках? Думаю на каждый язык распознавания инициализировать свой ps_decoder_t и выделять отдельный поток, в ктором будут идти блокирующие обращения к pd_decode_raw().
                          Или лучше иметь один декодер и при смене языка распознавания вызывать ps_init() для реинициализации декодера и всю работу организовать в единственном потоке?
                          Понимаю, что в первом случае потребуется очень много памяти, однако должен быть выигрыш в скорости на многоядерных установках?
                          Правильный ли ход мыслей? Заранее благодарен за советы и критику :)
                          Сообщение отредактировано: i7achi -
                            Цитата
                            Думаю на каждый язык распознавания инициализировать свой ps_decoder_t и выделять отдельный поток, в ктором будут идти блокирующие обращения к pd_decode_raw().


                            Так лучше.
                              Здравствуйте,
                              пытаюсь запустить демонстрацию DialogDemo из prbSphinx4-5prealpha.

                              Инициализирую переменные так:
                              private static final String ACOUSTIC_MODEL =
                              "resource:/AcousticModels/model_parameters/msu_ru_nsh.cd_cont_1000_8gau_16000";
                              private static final String DICTIONARY_PATH =
                              "resource:/AcousticModels/etc/msu_ru_nsh.dic";
                              private static final String GRAMMAR_PATH =
                              "resource:/edu/cmu/sphinx/demo/dialog/";
                              private static final String LANGUAGE_MODEL =
                              "resource:/AcousticModels/etc/msu_ru_nsh.lm.dmp";

                              при выполнении получаю ошибку:
                              Exception in thread "main" java.lang.IllegalStateException: javax.sound.sampled.LineUnavailableException: line with format PCM_SIGNED 16000.0 Hz, 16 bit, mono, 2 bytes/frame, little-endian not supported.
                              at edu.cmu.sphinx.api.Microphone.<init>(Microphone.java:38)
                              at edu.cmu.sphinx.api.SpeechSourceProvider.getMicrophone(SpeechSourceProvider.java:18)
                              at edu.cmu.sphinx.api.LiveSpeechRecognizer.<init>(LiveSpeechRecognizer.java:34)
                              at edu.cmu.sphinx.demo.dialog.DialogDemo.main(DialogDemo.java:144)
                              Caused by: javax.sound.sampled.LineUnavailableException: line with format PCM_SIGNED 16000.0 Hz, 16 bit, mono, 2 bytes/frame, little-endian not supported.
                              at com.sun.media.sound.DirectAudioDevice$DirectDL.implOpen(DirectAudioDevice.java:513)
                              at com.sun.media.sound.AbstractDataLine.open(AbstractDataLine.java:121)
                              Подскажите пожалуйста с чем это может быть связано.
                              Спасибо.

                              Добавлено
                              Цитата Young @
                              учту, спасибо

                              У Вас получилось исправить ошибку?
                                И почему, если использовать микрофон так:

                                Microphone microphone = (Microphone)cm.lookup("microphone");
                                if(!microphone.startRecording()){}

                                то ошибки не возникает.
                                0 пользователей читают эту тему (0 гостей и 0 скрытых пользователей)
                                0 пользователей:
                                Страницы: (23) « Первая ... 14 15 [16] 17 18 ...  22 23


                                Рейтинг@Mail.ru
                                [ Script execution time: 0,0496 ]   [ 17 queries used ]   [ Generated: 18.07.25, 17:09 GMT ]