На главную Наши проекты:
Журнал   ·   Discuz!ML   ·   Wiki   ·   DRKB   ·   Помощь проекту
ПРАВИЛА FAQ Помощь Участники Календарь Избранное RSS
msm.ru
Модераторы: RaD, nsh
Страницы: (23) « Первая ... 3 4 [5] 6 7 ...  22 23  ( Перейти к последнему сообщению )  
> Работа с CMU Sphinx , Работа с CMU Sphinx 4.0
    Цитата
    <do1> = ( включить | подключить | выключить | отключить | опросить );

    мой голос был в тренировочной базе
    распознаёт отлично
    попробуйте сделать адаптацию модели к вашему голосу
      правильно ли я понимаю - файл JSGF используется заместо правил распознавания? (я не могу вспомнить как оно правильно называется)
      Но при этом сам словарь так же необходим?
      В словаре так же надо писать латинскую транскрипцию на русские слова?
      Соответствие слова в модели и словаре должно быть 100%? (к примеру в модели есть 100 слов,а в словаре лишь 50 из них и больше ничего)
        Цитата
        правильно ли я понимаю - файл JSGF используется заместо правил распознавания? (я не могу вспомнить как оно правильно называется)


        Неправильно. JSGF файл содержит правила распознавания. Никакого "заместо" тут нет.

        Цитата
        Но при этом сам словарь так же необходим?


        Словарь содержит информацию о произношении слов, он необходим всегда

        Цитата
        В словаре так же надо писать латинскую транскрипцию на русские слова?


        В словаре содержится не латинская транскрипция, а фонетическая. Словарь для каждого слова задает звуки. Звуки обозначаются английскими буквами.

        Цитата
        Соответствие слова в модели и словаре должно быть 100%? (к примеру в модели есть 100 слов,а в словаре лишь 50 из них и больше ничего)


        Слова, отсутствующие в словаре не будут распознаваться.

        Возможно, Вам стоит прочитать введение в CMUSphinx, там эти вопросы разобраны:

        http://cmusphinx.sourceforge.net/wiki/tutorial
          тогда последний вопрос, я надеюсь.

          в данный момент я "подключаю" к сфинксу файлы .lm (dmp) и .dic ну и саму языковую модель.
          при использовании файла JSGF я его ДОПОЛНИТЕЛЬНО к представленному "набору" должен "подключить"?
            Цитата
            /home/SphinxTrain/bin/init_mixw \
            -src_moddeffn /home/SphinxTrain/model_architecture/msu_ru_zero.ci.mdef \
            -src_ts2cbfn .cont. \
            -src_mixwfn /home/SphinxTrain/model_parameters/msu_ru_zero.ci_cont/mixture_weights \
            -src_meanfn /home/SphinxTrain/model_parameters/msu_ru_zero.ci_cont/means \
            -src_varfn /home/SphinxTrain/model_parameters/msu_ru_zero.ci_cont/variances \
            -src_tmatfn /home/SphinxTrain/model_parameters/msu_ru_zero.ci_cont/transition_matrices \
            -dest_moddeffn /home/SphinxTrain/model_architecture/msu_ru_zero.untied.mdef \
            -dest_ts2cbfn .cont. \
            -dest_mixwfn /home/SphinxTrain/model_parameters/msu_ru_zero.cd_cont_untied/mixture_weights \
            -dest_meanfn /home/SphinxTrain/model_parameters/msu_ru_zero.cd_cont_untied/means \
            -dest_varfn /home/SphinxTrain/model_parameters/msu_ru_zero.cd_cont_untied/variances \
            -dest_tmatfn /home/SphinxTrain/model_parameters/msu_ru_zero.cd_cont_untied/transition_matrices \
            -fullvar yes


            Цитата
            Current configuration:
            [NAME] [DEFLT] [VALUE]
            -dest_meanfn /home/SphinxTrain/model_parameters/msu_ru_zero.cd_cont_untied/means
            -dest_mixwfn /home/SphinxTrain/model_parameters/msu_ru_zero.cd_cont_untied/mixture_weights
            -dest_moddeffn /home/SphinxTrain/model_architecture/msu_ru_zero.untied.mdef
            -dest_tmatfn /home/SphinxTrain/model_parameters/msu_ru_zero.cd_cont_untied/transition_matrices
            -dest_ts2cbfn .cont.
            -dest_varfn /home/SphinxTrain/model_parameters/msu_ru_zero.cd_cont_untied/variances
            -example no no
            -fullvar no yes
            -help no no
            -src_meanfn /home/SphinxTrain/model_parameters/msu_ru_zero.ci_cont/means
            -src_mixwfn /home/SphinxTrain/model_parameters/msu_ru_zero.ci_cont/mixture_weights
            -src_moddeffn /home/SphinxTrain/model_architecture/msu_ru_zero.ci.mdef
            -src_tmatfn /home/SphinxTrain/model_parameters/msu_ru_zero.ci_cont/transition_matrices
            -src_ts2cbfn .cont.
            -src_varfn /home/SphinxTrain/model_parameters/msu_ru_zero.ci_cont/variances

            INFO: main.c(263): Reading src /home/SphinxTrain/model_architecture/msu_ru_zero.ci.mdef
            INFO: model_def_io.c(587): Model definition info:
            INFO: model_def_io.c(588): 53 total models defined (53 base, 0 tri)
            INFO: model_def_io.c(589): 212 total states
            INFO: model_def_io.c(590): 159 total tied states
            INFO: model_def_io.c(591): 159 total tied CI states
            INFO: model_def_io.c(592): 53 total tied transition matrices
            INFO: model_def_io.c(593): 4 max state/model
            INFO: model_def_io.c(594): 4 min state/model
            INFO: main.c(280): Generating continous ts2cb mapping
            INFO: main.c(301): Reading src /home/SphinxTrain/model_parameters/msu_ru_zero.ci_cont/mixture_weights
            INFO: s3mixw_io.c(116): Read /home/SphinxTrain/model_parameters/msu_ru_zero.ci_cont/mixture_weights [159x1x32 array]
            INFO: main.c(310): Reading src /home/SphinxTrain/model_parameters/msu_ru_zero.ci_cont/transition_matrices
            INFO: s3tmat_io.c(115): Read /home/SphinxTrain/model_parameters/msu_ru_zero.ci_cont/transition_matrices [53x3x4 array]
            INFO: main.c(320): Reading src /home/SphinxTrain/model_parameters/msu_ru_zero.ci_cont/means
            INFO: s3gau_io.c(166): Read /home/SphinxTrain/model_parameters/msu_ru_zero.ci_cont/means [159x1x32 array]
            INFO: main.c(344): Reading src /home/SphinxTrain/model_parameters/msu_ru_zero.ci_cont/variances
            INFO: s3gau_full_io.c(173): Read /home/SphinxTrain/model_parameters/msu_ru_zero.ci_cont/variances [159x1x32 array of full matrices]
            INFO: main.c(392): Reading dest /home/SphinxTrain/model_architecture/msu_ru_zero.untied.mdef
            INFO: model_def_io.c(587): Model definition info:
            INFO: model_def_io.c(588): 53073 total models defined (53 base, 53020 tri)
            INFO: model_def_io.c(589): 212292 total states
            INFO: model_def_io.c(590): 159219 total tied states
            INFO: model_def_io.c(591): 159 total tied CI states
            INFO: model_def_io.c(592): 53 total tied transition matrices
            INFO: model_def_io.c(593): 4 max state/model
            INFO: model_def_io.c(594): 4 min state/model
            INFO: main.c(409): Generating continous ts2cb mapping
            INFO: main.c(433): Calculating initial model parameters
            INFO: main.c(438): Alloc 53x3x4 dest tmat
            INFO: main.c(451): Alloc 159219x1x32 dest mixw
            INFO: main.c(464): Alloc 159219x1x32 dest mean and var
            calloc(-840427424,4) failed from gauden.c(249)


            С чем может быть связана ошибка calloc(-840427424,4) failed from gauden.c(249) ?
              При попытке распознавания CI моделями при импользовании pocketsphinx также получаю ошибку
              Цитата
              INFO: ms_gauden.c(198): Reading mixture gaussian parameter: /home/SphinxTrain/model_parameters/msu_ru_zero.ci_cont/means
              INFO: ms_gauden.c(292): 159 codebook, 1 feature, size:
              INFO: ms_gauden.c(294): 32x39
              INFO: ms_gauden.c(198): Reading mixture gaussian parameter: /home/SphinxTrain/model_parameters/msu_ru_zero.ci_cont/variances
              FATAL_ERROR: "ms_gauden.c", line 254: /home/SphinxTrain/model_parameters/msu_ru_zero.ci_cont/variances: #mfcc_ts(7738848) doesn't match dimensions: 159 x 32 x 39


              Такой ошибки нет при использовании sphinx3
                Подскажите пожалуйста, есть ли ограничение на размер JSGF файлов и если да, то чем это объясняется? И для чего при создании словаря в дополнение к .dic генерируется файл .dic.accent, не нашел флагов для передачи его имени в аргументах программы?
                  Цитата
                  Подскажите пожалуйста, есть ли ограничение на размер JSGF файлов и если да, то чем это объясняется?


                  в любом ПО всегда есть ограничения на размер чего-то =)
                  JSGF "компилируется" при запуске
                  его следует использовать только с малым количеством слов
                  при большом количестве слов надо использовать языковую модель

                  Цитата
                  И для чего при создании словаря в дополнение к .dic генерируется файл .dic.accent, не нашел флагов для передачи его имени в аргументах программы?

                  это касается только проекта ru4sphinx =)
                  этот файл в распознавании не используется
                  я применяю его только для того что бы узанать на какую гласную упало ударение, с целью автоматического проставления ударения
                  Сообщение отредактировано: zamir -
                    Цитата zamir @
                    в любом ПО всегда есть ограничения на размер чего-то =)

                    Это я понимаю=) Имеется ввиду, есть ли какие-то известные ограничения, выше которых быстрее работает языковая модель. Т.е., например, при более чем 100 слов в одном правиле с альтернативами <rule>=(первый | второй | третий | ..... | сотый), или при каком-то уровне вложенности правил?
                    Цитата zamir @
                    JSGF "компилируется" при запуске

                    А можно ли как-то скомпилировать заранее?
                      по граничениям ничего конректного сказать не могу

                      Цитата
                      А можно ли как-то скомпилировать заранее?


                      да
                      при помощи sphinx_jsgf2fsg
                        Цитата zamir @
                        при помощи sphinx_jsgf2fsg

                        Спасибо за информацию
                          Цитата zamir @
                          я применяю его только для того что бы узанать на какую гласную упало ударение, с целью автоматического проставления ударения

                          А на основании какой базы были составлены/сгенерены файлы ударений *_word.txt, которые как я понимаю используются скриптом accent_train для создания базы ударений accent.base?
                            Цитата
                            А на основании какой базы были составлены/сгенерены файлы ударений *_word.txt

                            существующая база ударений (найдена в интернет и переработанная) + вручную добавленные слова
                              Цитата
                              импорта этого скоропортящегося *** *** *** *** *** *** ПРОДУКТА вдобавок *** *** КАК ОН сам признавал *** *** тщательно избегал *** РОДИМЫХ (WAV-2009
                              импорта этого скоропортящегося ПРОДУКТЫ И В В И В В вдобавок СЕЙЧАС ОСНОВАТЕЛЬ В КАКОМ сам признавал И С тщательно избегал И РОДИМ (WAV-2009
                              Words: 12 Correct: 8 Errors: 15 Percent correct = 66.67% Error = 125.00% Accuracy = -25.00%


                              Николай, посмотрите Error = 125.00% Accuracy = -25.00% - это неверное не совсем верно
                              Использую версию 0.7 возможно в 0.8 уже исправлено?
                                Цитата
                                Николай, посмотрите


                                Куда смотреть то?
                                1 пользователей читают эту тему (1 гостей и 0 скрытых пользователей)
                                0 пользователей:
                                Страницы: (23) « Первая ... 3 4 [5] 6 7 ...  22 23


                                Рейтинг@Mail.ru
                                [ Script execution time: 0,0474 ]   [ 14 queries used ]   [ Generated: 18.07.25, 01:36 GMT ]