На главную Наши проекты:
Журнал   ·   Discuz!ML   ·   Wiki   ·   DRKB   ·   Помощь проекту
ПРАВИЛА FAQ Помощь Участники Календарь Избранное RSS
msm.ru
Модераторы: RaD, nsh
Страницы: (23) « Первая ... 19 20 [21] 22 23   ( Перейти к последнему сообщению )  
> Работа с CMU Sphinx , Работа с CMU Sphinx 4.0
    Вот сами записи: https://yadi.sk/d/oXsrB6er3Abv7M
      Для bw нужно добавить -lda cmusphinx-ru-5.2/feature_transform, это в документации указано.

      Для уверенного распознавания нужно микрофон хороший.
        Цитата
        Для bw нужно добавить -lda cmusphinx-ru-5.2/feature_transform, это в документации указано.


        Да, всё классно, это исправило ситуацию. Спасибо большое! Буду пробовать :lol:
          Развернул библиотеку распознавания sphinx в программе на C#. Привет, как вывести в окно программы процент распознавания, ошибок, если я использую словарь JSpeech Grammar Format (JSGF)? Программа реализована на C#.
            Добрый вечер.
            Пытаюсь разобраться как работает pocketsphinx. На официальном сайте хорошо описано как с ним работать, но практически не описана его архитектура, используемые алгоритмы. Искал в интернете, но нашел только статью про сфинкс-4. Есть ли похожая про pocketsphinx, и если нет то где можно узнать архитектуру и используемые алгоритмы. Насколько сильно pocketsphinx в этом пересекается с sphinx-4?

            Статья - http://egouvea.users.sourceforge.net/paper...tr-2004-139.pdf
            Сообщение отредактировано: Kenait -
                Спасибо, то что нужно. Другой вопрос - есть ли способы редактировать словарь кроме как вручную? Я создаю простую программу - "органайзер", которая будет записывать запланированные мероприятия, и слишком большой словарь только снизит точность. Имеет ли смысл искать способы урезать уже готовый или стоит создать новый словарь для моей программы?
                  Цитата Kenait @
                  Другой вопрос - есть ли способы редактировать словарь кроме как вручную? Я создаю простую программу - "органайзер", которая будет записывать запланированные мероприятия, и слишком большой словарь только снизит точность. Имеет ли смысл искать способы урезать уже готовый или стоит создать новый словарь для моей программы?


                  Словарь редактировать плохая идея, нужно редактировать модель языка, например, грамматику. А словарь лучше оставить как есть.
                    Спасибо за ответ. Я создал грамматику для ввода даты мероприятия, но хотел оставить свободную речь для описания самого мероприятия. Так или иначе пока что просто буду работать по туториалу - в последних главах как раз рассматривается вопрос точности.
                      Снова возник вопрос.
                      Я распознаю речь с микрофона, который пишет на 48000 гц. Как я понимаю это может понизить точность распознавания. В этой теме упоминалось что необходимо ввести в параметрах -samprate 48000, однако если я делаю такую настройку выводится ошибка:
                      ERROR: "fe_interface.c", line 105: FFT: Number of points must be greater or equal to frame size (1230 samples)
                        Цитата Kenait @
                        Снова возник вопрос.
                        Я распознаю речь с микрофона, который пишет на 48000 гц. Как я понимаю это может понизить точность распознавания. В этой теме упоминалось что необходимо ввести в параметрах -samprate 48000, однако если я делаю такую настройку выводится ошибка:
                        ERROR: "fe_interface.c", line 105: FFT: Number of points must be greater or equal to frame size (1230 samples)


                        Нужно nfft указать

                        ExpandedWrap disabled
                          -samprate 48000 -nfft 2048


                        Лучше драйвер настроить чтобы частоту дискретизации изменял самостоятельно.
                          На данный момент я тестирую точность распознавания и у меня возник вопрос - в туториале советуется после проведения теста использовать скрипт word_align.pl. Как это точно сделать? Если я правильно понял то нужно после выполнения тестирования ввести в командную строку файл скрипта, затем файл транскрипции, затем файл гипотезы. Но вместо работы скрипта у меня просто выводит его текст в блокноте. Что я делаю не так?
                            Цитата Kenait @
                            Что я делаю не так?


                            Windows используете.
                              Я установил perl, и теперь при запуске команды C:\Users\User>"E:\CMU Sphinx\sphinxtrain\scripts\decode\word_align.pl" "E:\CMU Sphinx\pocketsphinx\bin\Release\Win32\wav\arctic20.transcription" "E:\CMU Sphinx\pocketsphinx\bin\Release\Win32\wav\arctic20.hyp"
                              получаю на выходе строку:
                              Usage:
                              word_align [options] reference_file hypothesis_file
                              Сообщение отредактировано: Kenait -
                                После проведения адаптации акустической модели результаты распознавания только ухудшились. Относится ли это к использованию русской языковой модели, или я провел адаптацию неправильно? Проверку провел на наборе данных, который использовал при адаптации. Как я понял точность распознавания должна была резко возрасти, но вместо этого ухудшилась.
                                0 пользователей читают эту тему (0 гостей и 0 скрытых пользователей)
                                0 пользователей:
                                Страницы: (23) « Первая ... 19 20 [21] 22 23 


                                Рейтинг@Mail.ru
                                [ Script execution time: 0,0464 ]   [ 16 queries used ]   [ Generated: 25.04.24, 05:02 GMT ]