На главную Наши проекты:
Журнал   ·   Discuz!ML   ·   Wiki   ·   DRKB   ·   Помощь проекту
ПРАВИЛА FAQ Помощь Участники Календарь Избранное RSS
msm.ru
Модераторы: RaD, nsh
Страницы: (4) « Первая ... 2 3 [4]  все  ( Перейти к последнему сообщению )  
> Возможны ли динамические n-граммы в CMU sphinx?
    если не секрет, в плане повышения правильности распознавания сфинкса, какое самое перспективное направление разработки? языковая модель и адаптация акустики - это понятно)
    Сообщение отредактировано: w3264 -
      Цитата
      в плане повышения правильности распознавания сфинкса, какое самое перспективное направление разработки?


      Более точная акустическая модель.

      Цитата
      языковая модель и адаптация акустики - это понятно)


      Мне не понятно.
        Цитата nsh @

        Более точная акустическая модель.

        имеется ввиду большая выборка обучения акустики, 400 часов, 1000, 2000 и тд?
        Сообщение отредактировано: w3264 -
          Цитата w3264 @
          имеется ввиду большая выборка обучения акустики, 400 часов, 1000, 2000 и тд?


          Имеется ввиду более точная модель, сегодняшние распознавалки с DNN гораздо более точно описывают речь. Объём базы тоже влияет на точность распознавания, но не так сильно. Текущий объём английской базы около 1000 часов уже.
            -- сегодняшние распознавалки с DNN гораздо более точно описывают речь.

            если судить по научным статьям, то на одной и той же базе обучения днн-ки дают прибавку в точности 5-10%, не более

            опять же возникает вопрос, почему днн-ки не стоят в очереди на реализацию в сфинксе?
            Сообщение отредактировано: w3264 -
              Цитата
              если судить по научным статьям, то на одной и той же базе обучения днн-ки дают прибавку в точности 5-10%, не более


              50%.

              Цитата
              опять же возникает вопрос, почему днн-ки не стоят в очереди на реализацию в сфинксе?


              Мы не гоняемся за модными технологиями.
                -- 50%
                если судить по википедии, то точность сфинкса около 80%, улучшения на 50% быть не может)

                -- Мы не гоняемся за модными технологиями.
                прошу прощения, несерьезный ответ, это эффективная технология в первую очередь
                  снова вопрос по kws

                  если за ключевым словом идет тишина, то детект хороший
                  если за ключевым словом идет слитная речь, то детект хреновенький, надо специально делать короткую паузу после ключевого слова, что не здорово
                  как это можно полечить?
                    только что обратил внимание ...
                    16 кгц русской модели нет?
                    Сообщение отредактировано: w3264 -
                        кстати говоря, сфинкс с его 'устаревшими' гауссовыми смесями в моей предметной области работает лучше гугла ... но с моей языковой моделью, акустическая адаптация - уже второй порядок малости в плане качества, улучшает распознавание некоторых слов, предлогов ...

                        в общем респекты разработчикам сфинкса)


                        *** на правах рекламы)))
                          Спасибо
                          0 пользователей читают эту тему (0 гостей и 0 скрытых пользователей)
                          0 пользователей:


                          Рейтинг@Mail.ru
                          [ Script execution time: 0,0291 ]   [ 15 queries used ]   [ Generated: 28.03.24, 22:47 GMT ]