Наши проекты:
Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту |
||
ПРАВИЛА | FAQ | Помощь | Поиск | Участники | Календарь | Избранное | RSS |
[3.144.86.134] |
|
Сообщ.
#1
,
|
|
|
Пока не понял как можно записывать в микрофона звук в необходимом для Pocketsphinx формате, чтобы сразу можно было отсылать на распознавание. Записывать в файл и читать от туда кажется очень сильно костылями. Может кто уже решал схожую задачу? Использую обычную MVS 2010, не для embedded.
|
Сообщ.
#2
,
|
|
|
Цитата как можно записывать в микрофона звук в необходимом для Pocketsphinx формате, чтобы сразу можно было отсылать на распознавание Вот так: https://sourceforge.net/p/cmusphinx/code/11...ntinuous.c#l234 |
Сообщ.
#3
,
|
|
|
Огромное спасибо за столь высокую оперативность.
|
Сообщ.
#4
,
|
|
|
Ещё хотелось бы спросить, при сборке pocketsphinx выдает ошибку в виде окошка - "Не удается запустить программу ..... Debug\pocketsphinx.dll" при этом проект собирается без ошибок. Предварительно переименовал папку sphinxbase как было написано в туториале, все в одну папку, далее подобавлял все включаемые фаилы, которые оно требовало, чтобы все компилилось. И вот под финал столкнулся с такой задачкой.
Пробовал из командной строки с помощью аргументов выводить русское распознавание (в консоли иероглифы не смотря на ихменение кодировки) модель брал voxforge-ru-0.2. D:\Robot\sphinx\pocketsphinx-0.7-win32\pocketsphinx-0.7-win32\pocketsphinx_continuous.exe -hmm D:\Robot\sphinx\voxforge-ru-0.2\model_parameters\msu_ru_nsh.cd_cont_1000_8gau_16000 -lm D:\Robot\sphinx\voxforge-ru-0.2\etc\msu_ru_nsh.lm.dmp -dict D:\Robot\sphinx\voxforge-ru-0.2\etc\msu_ru_nsh.dic -fdict D:\Robot\sphinx\voxforge-ru-0.2\etc\msu_ru_nsh.filler -samprate 16000 -hypseg D:\Robot\sphinx\pocketsphinx-0.7-win32\pocketsphinx-0.7-win32\OutPutStream.match К сожалению -hypseg не дал результатов ни с .match ни с .txt Благодарен за помощь ламеру ) Добавлено Да и ещё вопрос #include <continuous.c> #include "stdafx.h" #include <pocketsphinx.h> int main(int argc, char *argv[]) { ps_decoder_t *ps; cmd_ln_t *config; FILE *fh; char const *hyp, *uttid; int16 buf[512]; int rv; int32 score; config = cmd_ln_init(NULL, ps_args(), TRUE, "-hmm","D:\Robot\sphinx\voxforge-ru-0.2\model_parameters\msu_ru_nsh.cd_cont_1000_8gau_16000", "-lm", "D:\Robot\sphinx\voxforge-ru-0.2\etc\msu_ru_nsh.lm.dmp", "-dict","D:\Robot\sphinx\voxforge-ru-0.2\etc\msu_ru_nsh.dic", "-fdict","D:\Robot\sphinx\voxforge-ru-0.2\etc\msu_ru_nsh.filler", "-samprate", "16000", NULL); if (config == NULL) return 1; recognize_from_microphone(); return 0; } Ошибка 26 error C3861: recognize_from_microphone: идентификатор не найден c:\users\user\documents\visual studio 2010\projects\testpocketsphinx\testpocketsphinx\testpocketsphinx.cpp 49 1 TestPocketSphinx До вставки строки recognize_from_microphone(); пример с туториала собирался. |
Сообщ.
#5
,
|
|
|
Цитата в консоли иероглифы не смотря на ихменение кодировки кодировка utf-8 Цитата К сожалению -hypseg не дал результатов ни с .match ни с .txt Pocketsphinx_continuous не сохраняет результаты в hypseg, а выводит их на стандартный вывод. Цитата Ошибка 26 error C3861: recognize_from_microphone: идентификатор не найден c:\users\user\documents\visual studio 2010\projects\testpocketsphinx\testpocketsphinx\testpocketsphinx.cpp 49 1 TestPocketSphinx Функцию recognize_from_microphone из примера тоже надо было скопировать. |
Сообщ.
#6
,
|
|
|
кодировку ставил в консоли вот таким способом "chcp 866" в Winwis 7.
при произношении "Привет" выдает INFO: ngram_search.c(1214): </s> not found in last frame, using ╤В╨╡╨╝.60 instead INFO: ngram_search.c(1266): lattice start node <s>.0 end node ╤В╨╡╨╝.2 INFO: ngram_search.c(1294): Eliminated 40 nodes before end node INFO: ngram_search.c(1399): Lattice has 75 nodes, 1 links INFO: ps_lattice.c(1365): Normalizer P(O) = alpha(╤В╨╡╨╝:2:60) = -174863 INFO: ps_lattice.c(1403): Joint P(O,S) = -174863 P(S|O) = 0 INFO: ngram_search.c(888): bestpath 0.00 CPU 0.000 xRT INFO: ngram_search.c(891): bestpath 0.00 wall 0.007 xRT 000000001: ╤В╨╡╨╝ Пробовал в исходниках pocketsphinx в continious в функции main ставить setlocale(LC_ALL,"Russian"); В результате меняются иероглифы )))) Current configuration: [NAME] [DEFLT] [VALUE] -adcdev -agc none none -agcthresh 2.0 2,000000e+000 -alpha 0.97 9,700000e-001 -argfile -ascale 20.0 2,000000e+001 -aw 1 1 -backtrace no no -beam 1e-48 1,000000e-048 -bestpath yes yes -bestpathlw 9.5 9,500000e+000 -bghist no no -ceplen 13 13 -cmn current current -cmninit 8.0 8.0 -compallsen no no -debug 0 -dict D:\Robot\sphinx\voxforge-ru-0.2\etc\msu_ru_nsh.d ic -dictcase no no -dither no no -doublebw no no -ds 1 1 -fdict D:\Robot\sphinx\voxforge-ru-0.2\etc\msu_ru_nsh.f iller -feat 1s_c_d_dd 1s_c_d_dd -featparams -fillprob 1e-8 1,000000e-008 -frate 100 100 -fsg -fsgusealtpron yes yes -fsgusefiller yes yes -fwdflat yes yes -fwdflatbeam 1e-64 1,000000e-064 -fwdflatefwid 4 4 -fwdflatlw 8.5 8,500000e+000 -fwdflatsfwin 25 25 -fwdflatwbeam 7e-29 7,000000e-029 -fwdtree yes yes -hmm D:\Robot\sphinx\voxforge-ru-0.2\model_parameters \msu_ru_nsh.cd_cont_1000_8gau_16000 -infile -input_endian little little -jsgf -kdmaxbbi -1 -1 -kdmaxdepth 0 0 -kdtree -latsize 5000 5000 -lda -ldadim 0 0 -lextreedump 0 0 -lifter 0 0 -lm D:\Robot\sphinx\voxforge-ru-0.2\etc\msu_ru_nsh.l m.dmp -lmctl -lmname default default -logbase 1.0001 1,000100e+000 -logfn -logspec no no -lowerf 133.33334 1,333333e+002 -lpbeam 1e-40 1,000000e-040 -lponlybeam 7e-29 7,000000e-029 -lw 6.5 6,500000e+000 -maxhmmpf -1 -1 -maxnewoov 20 20 -maxwpf -1 -1 -mdef -mean -mfclogdir -min_endfr 0 0 -mixw -mixwfloor 0.0000001 1,000000e-007 -mllr -mmap yes yes -ncep 13 13 -nfft 512 512 -nfilt 40 40 -nwpen 1.0 1,000000e+000 -pbeam 1e-48 1,000000e-048 -pip 1.0 1,000000e+000 -pl_beam 1e-10 1,000000e-010 -pl_pbeam 1e-5 1,000000e-005 -pl_window 0 0 -rawlogdir -remove_dc no no -round_filters yes yes -samprate 16000 1,600000e+004 -seed -1 -1 -sendump -senlogdir -senmgau -silprob 0.005 5,000000e-003 -smoothspec no no -svspec -time no no -tmat -tmatfloor 0.0001 1,000000e-004 -topn 4 4 -topn_beam 0 0 -toprule -transform legacy legacy -unit_area yes yes -upperf 6855.4976 6,855498e+003 -usewdphones no no -uw 1.0 1,000000e+000 -var -varfloor 0.0001 1,000000e-004 -varnorm no no -verbose no no -warp_params -warp_type inverse_linear inverse_linear -wbeam 7e-29 7,000000e-029 -wip 0.65 6,500000e-001 -wlen 0.025625 2,562500e-002 INFO: cmd_ln.c(691): Parsing command line: \ -alpha 0.97 \ -dither yes \ -doublebw no \ -nfilt 40 \ -ncep 13 \ -lowerf 133.33334 \ -upperf 6855.4976 \ -nfft 512 \ -wlen 0.0256 \ -transform legacy \ -feat 1s_c_d_dd \ -agc none \ -cmn current \ -varnorm no Current configuration: [NAME] [DEFLT] [VALUE] -agc none none -agcthresh 2.0 2,000000e+000 -alpha 0.97 9,700000e-001 -ceplen 13 13 -cmn current current -cmninit 8.0 8.0 -dither no yes -doublebw no no -feat 1s_c_d_dd 1s_c_d_dd -frate 100 100 -input_endian little little -lda -ldadim 0 0 -lifter 0 0 -logspec no no -lowerf 133.33334 1,333333e+002 -ncep 13 13 -nfft 512 512 -nfilt 40 40 -remove_dc no no -round_filters yes yes -samprate 16000 1,600000e+004 -seed -1 -1 -smoothspec no no -svspec -transform legacy legacy -unit_area yes yes -upperf 6855.4976 6,855498e+003 -varnorm no no -verbose no no -warp_params -warp_type inverse_linear inverse_linear -wlen 0.025625 2,560000e-002 INFO: acmod.c(246): Parsed model-specific feature parameters from D:\Robot\sphin x\voxforge-ru-0.2\model_parameters\msu_ru_nsh.cd_cont_1000_8gau_16000/feat.param s INFO: fe_interface.c(299): You are using the internal mechanism to generate the seed. INFO: feat.c(713): Initializing feature stream to type: '1s_c_d_dd', ceplen=13, CMN='current', VARNORM='no', AGC='none' INFO: cmn.c(142): mean[0]= 12,00, mean[1..12]= 0.0 INFO: mdef.c(517): Reading model definition: D:\Robot\sphinx\voxforge-ru-0.2\mod el_parameters\msu_ru_nsh.cd_cont_1000_8gau_16000/mdef INFO: bin_mdef.c(179): Allocating 113108 * 8 bytes (883 KiB) for CD tree INFO: tmat.c(205): Reading HMM transition probability matrices: D:\Robot\sphinx\ voxforge-ru-0.2\model_parameters\msu_ru_nsh.cd_cont_1000_8gau_16000/transition_m atrices INFO: acmod.c(121): Attempting to use SCHMM computation module INFO: ms_gauden.c(198): Reading mixture gaussian parameter: D:\Robot\sphinx\voxf orge-ru-0.2\model_parameters\msu_ru_nsh.cd_cont_1000_8gau_16000/means INFO: ms_gauden.c(292): 1153 codebook, 1 feature, size: INFO: ms_gauden.c(294): 8x39 INFO: ms_gauden.c(198): Reading mixture gaussian parameter: D:\Robot\sphinx\voxf orge-ru-0.2\model_parameters\msu_ru_nsh.cd_cont_1000_8gau_16000/variances INFO: ms_gauden.c(292): 1153 codebook, 1 feature, size: INFO: ms_gauden.c(294): 8x39 INFO: ms_gauden.c(354): 879 variance values floored INFO: acmod.c(123): Attempting to use PTHMM computation module INFO: ms_gauden.c(198): Reading mixture gaussian parameter: D:\Robot\sphinx\voxf orge-ru-0.2\model_parameters\msu_ru_nsh.cd_cont_1000_8gau_16000/means INFO: ms_gauden.c(292): 1153 codebook, 1 feature, size: INFO: ms_gauden.c(294): 8x39 INFO: ms_gauden.c(198): Reading mixture gaussian parameter: D:\Robot\sphinx\voxf orge-ru-0.2\model_parameters\msu_ru_nsh.cd_cont_1000_8gau_16000/variances INFO: ms_gauden.c(292): 1153 codebook, 1 feature, size: INFO: ms_gauden.c(294): 8x39 INFO: ms_gauden.c(354): 879 variance values floored INFO: ptm_mgau.c(800): Number of codebooks exceeds 256: 1153 INFO: acmod.c(125): Falling back to general multi-stream GMM computation INFO: ms_gauden.c(198): Reading mixture gaussian parameter: D:\Robot\sphinx\voxf orge-ru-0.2\model_parameters\msu_ru_nsh.cd_cont_1000_8gau_16000/means INFO: ms_gauden.c(292): 1153 codebook, 1 feature, size: INFO: ms_gauden.c(294): 8x39 INFO: ms_gauden.c(198): Reading mixture gaussian parameter: D:\Robot\sphinx\voxf orge-ru-0.2\model_parameters\msu_ru_nsh.cd_cont_1000_8gau_16000/variances INFO: ms_gauden.c(292): 1153 codebook, 1 feature, size: INFO: ms_gauden.c(294): 8x39 INFO: ms_gauden.c(354): 879 variance values floored INFO: ms_senone.c(160): Reading senone mixture weights: D:\Robot\sphinx\voxforge -ru-0.2\model_parameters\msu_ru_nsh.cd_cont_1000_8gau_16000/mixture_weights INFO: ms_senone.c(211): Truncating senone logs3(pdf) values by 10 bits INFO: ms_senone.c(218): Not transposing mixture weights in memory INFO: ms_senone.c(277): Read mixture weights for 1153 senones: 1 features x 8 co dewords INFO: ms_senone.c(331): Mapping senones to individual codebooks INFO: ms_mgau.c(141): The value of topn: 4 INFO: dict.c(317): Allocating 190163 * 20 bytes (3714 KiB) for word entries INFO: dict.c(332): Reading main dictionary: D:\Robot\sphinx\voxforge-ru-0.2\etc\ msu_ru_nsh.dic INFO: dict.c(211): Allocated 3211 KiB for strings, 3214 KiB for phones INFO: dict.c(335): 186063 words read INFO: dict.c(341): Reading filler dictionary: D:\Robot\sphinx\voxforge-ru-0.2\et c\msu_ru_nsh.filler INFO: dict.c(211): Allocated 0 KiB for strings, 0 KiB for phones INFO: dict.c(344): 4 words read INFO: dict2pid.c(396): Building PID tables for dictionary INFO: dict2pid.c(404): Allocating 51^3 * 2 bytes (259 KiB) for word-initial trip hones INFO: dict2pid.c(131): Allocated 31416 bytes (30 KiB) for word-final triphones INFO: dict2pid.c(195): Allocated 31416 bytes (30 KiB) for single-phone word trip hones INFO: ngram_model_arpa.c(77): No \data\ mark in LM file INFO: ngram_model_dmp.c(142): Will use memory-mapped I/O for LM file INFO: ngram_model_dmp.c(196): ngrams 1=19941, 2=805517, 3=227533 INFO: ngram_model_dmp.c(242): 19941 = LM.unigrams(+trailer) read INFO: ngram_model_dmp.c(291): 805517 = LM.bigrams(+trailer) read INFO: ngram_model_dmp.c(317): 227533 = LM.trigrams read INFO: ngram_model_dmp.c(342): 12483 = LM.prob2 entries read INFO: ngram_model_dmp.c(362): 8800 = LM.bo_wt2 entries read INFO: ngram_model_dmp.c(382): 11407 = LM.prob3 entries read INFO: ngram_model_dmp.c(410): 1574 = LM.tseg_base entries read INFO: ngram_model_dmp.c(466): 19941 = ascii word strings read INFO: ngram_search_fwdtree.c(99): 859 unique initial diphones INFO: ngram_search_fwdtree.c(147): 0 root, 0 non-root channels, 18 single-phone words INFO: ngram_search_fwdtree.c(186): Creating search tree INFO: ngram_search_fwdtree.c(191): before: 0 root, 0 non-root channels, 18 singl e-phone words INFO: ngram_search_fwdtree.c(326): after: max nonroot chan increased to 44147 INFO: ngram_search_fwdtree.c(338): after: 610 root, 44019 non-root channels, 16 single-phone words INFO: ngram_search_fwdflat.c(156): fwdflat: min_ef_width = 4, max_sf_win = 25 INFO: continuous.c(378): D:\Robot\Sphinx3\code\pocketsphinx\bin\Release\pocketsp hinx_continuous.exe COMPILED ON: Nov 10 2012, AT: 21:27:06 Allocating 32 buffers of 2500 samples each READY.... Listening... Stopped listening, please wait... INFO: cmn_prior.c(121): cmn_prior_update: from < 8,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 > INFO: cmn_prior.c(139): cmn_prior_update: to < 12,94 0,52 -0,64 -0,10 -0,17 - 0,25 -0,03 -0,28 -0,31 -0,18 -0,16 -0,10 -0,30 > INFO: ngram_search_fwdtree.c(1549): 1658 words recognized (7/fr) INFO: ngram_search_fwdtree.c(1551): 190159 senones evaluated (749/fr) INFO: ngram_search_fwdtree.c(1553): 791455 channels searched (3115/fr), 130634 1st, 34982 last INFO: ngram_search_fwdtree.c(1557): 5156 words for which last channels evalu ated (20/fr) INFO: ngram_search_fwdtree.c(1560): 26239 candidate words for entering last p hone (103/fr) INFO: ngram_search_fwdtree.c(1562): fwdtree 0,87 CPU 0,344 xRT INFO: ngram_search_fwdtree.c(1565): fwdtree 3,52 wall 1,387 xRT INFO: ngram_search_fwdflat.c(305): Utterance vocabulary contains 88 words INFO: ngram_search_fwdflat.c(940): 980 words recognized (4/fr) INFO: ngram_search_fwdflat.c(942): 32305 senones evaluated (127/fr) INFO: ngram_search_fwdflat.c(944): 55646 channels searched (219/fr) INFO: ngram_search_fwdflat.c(946): 6017 words searched (23/fr) INFO: ngram_search_fwdflat.c(948): 2694 word transitions (10/fr) INFO: ngram_search_fwdflat.c(951): fwdflat 0,08 CPU 0,031 xRT INFO: ngram_search_fwdflat.c(954): fwdflat 0,10 wall 0,041 xRT INFO: ngram_search.c(1214): </s> not found in last frame, using Р?С?РчР?С?.252 i nstead INFO: ngram_search.c(1266): lattice start node <s>.0 end node Р?С?РчР?С?.24 INFO: ngram_search.c(1294): Eliminated 3 nodes before end node INFO: ngram_search.c(1399): Lattice has 68 nodes, 55 links INFO: ps_lattice.c(1365): Normalizer P(O) = alpha(Р?С?РчР?С?:24:252) = -451783 INFO: ps_lattice.c(1403): Joint P(O,S) = -451911 P(S|O) = -128 INFO: ngram_search.c(888): bestpath 0,02 CPU 0,006 xRT INFO: ngram_search.c(891): bestpath 0,08 wall 0,032 xRT 000000000: Р?Р? Р?С?РчР?С? READY.... Не понимаю где я туплю ((( |
Сообщ.
#7
,
|
|
|
"chcp 866" и utf-8 разные вещи, нужно ставить UTF-8:
Цитата Где параметр <codepage> для UTF-8 равен 65001 http://anvarichn.livejournal.com/43752.html |
Сообщ.
#8
,
|
|
|
Оказывается такое большое различие, даже бы не догадался.
Прямо перед выполнением набираю команду chcp 65001 и к сожалению вот вывод pocketsphinx -adcdev -agc none none -agcthresh 2.0 2,000000e+000 -alpha 0.97 9,700000e-001 -argfile -ascale 20.0 2,000000e+001 -aw 1 1 -backtrace no no -beam 1e-48 1,000000e-048 -bestpath yes yes -bestpathlw 9.5 9,500000e+000 -bghist no no -ceplen 13 13 -cmn current current -cmninit 8.0 8.0 -compallsen no no -debug 0 -dict D:\Robot\sphinx\voxforge-ru-0.2\etc\msu_ru_nsh.d ic -dictcase no no -dither no no -doublebw no no -ds 1 1 -fdict D:\Robot\sphinx\voxforge-ru-0.2\etc\msu_ru_nsh.f iller -feat 1s_c_d_dd 1s_c_d_dd -featparams -fillprob 1e-8 1,000000e-008 -frate 100 100 -fsg -fsgusealtpron yes yes -fsgusefiller yes yes -fwdflat yes yes -fwdflatbeam 1e-64 1,000000e-064 -fwdflatefwid 4 4 -fwdflatlw 8.5 8,500000e+000 -fwdflatsfwin 25 25 -fwdflatwbeam 7e-29 7,000000e-029 -fwdtree yes yes -hmm D:\Robot\sphinx\voxforge-ru-0.2\model_parameters \msu_ru_nsh.cd_cont_1000_8gau_16000 -infile -input_endian little little -jsgf -kdmaxbbi -1 -1 -kdmaxdepth 0 0 -kdtree -latsize 5000 5000 -lda -ldadim 0 0 -lextreedump 0 0 -lifter 0 0 -lm D:\Robot\sphinx\voxforge-ru-0.2\etc\msu_ru_nsh.l m.dmp -lmctl -lmname default default -logbase 1.0001 1,000100e+000 -logfn -logspec no no -lowerf 133.33334 1,333333e+002 -lpbeam 1e-40 1,000000e-040 -lponlybeam 7e-29 7,000000e-029 -lw 6.5 6,500000e+000 -maxhmmpf -1 -1 -maxnewoov 20 20 -maxwpf -1 -1 -mdef -mean -mfclogdir -min_endfr 0 0 -mixw -mixwfloor 0.0000001 1,000000e-007 -mllr -mmap yes yes -ncep 13 13 -nfft 512 512 -nfilt 40 40 -nwpen 1.0 1,000000e+000 -pbeam 1e-48 1,000000e-048 -pip 1.0 1,000000e+000 -pl_beam 1e-10 1,000000e-010 -pl_pbeam 1e-5 1,000000e-005 -pl_window 0 0 -rawlogdir -remove_dc no no -round_filters yes yes -samprate 16000 1,600000e+004 -seed -1 -1 -sendump -senlogdir -senmgau -silprob 0.005 5,000000e-003 -smoothspec no no -svspec -time no no -tmat -tmatfloor 0.0001 1,000000e-004 -topn 4 4 -topn_beam 0 0 -toprule -transform legacy legacy -unit_area yes yes -upperf 6855.4976 6,855498e+003 -usewdphones no no -uw 1.0 1,000000e+000 -var -varfloor 0.0001 1,000000e-004 -varnorm no no -verbose no no -warp_params -warp_type inverse_linear inverse_linear -wbeam 7e-29 7,000000e-029 -wip 0.65 6,500000e-001 -wlen 0.025625 2,562500e-002 INFO: cmd_ln.c(691): Parsing command line: \ -alpha 0.97 \ -dither yes \ -doublebw no \ -nfilt 40 \ -ncep 13 \ -lowerf 133.33334 \ -upperf 6855.4976 \ -nfft 512 \ -wlen 0.0256 \ -transform legacy \ -feat 1s_c_d_dd \ -agc none \ -cmn current \ -varnorm no Current configuration: [NAME] [DEFLT] [VALUE] -agc none none -agcthresh 2.0 2,000000e+000 -alpha 0.97 9,700000e-001 -ceplen 13 13 -cmn current current -cmninit 8.0 8.0 -dither no yes -doublebw no no -feat 1s_c_d_dd 1s_c_d_dd -frate 100 100 -input_endian little little -lda -ldadim 0 0 -lifter 0 0 -logspec no no -lowerf 133.33334 1,333333e+002 -ncep 13 13 -nfft 512 512 -nfilt 40 40 -remove_dc no no -round_filters yes yes -samprate 16000 1,600000e+004 -seed -1 -1 -smoothspec no no -svspec -transform legacy legacy -unit_area yes yes -upperf 6855.4976 6,855498e+003 -varnorm no no -verbose no no -warp_params -warp_type inverse_linear inverse_linear -wlen 0.025625 2,560000e-002 INFO: acmod.c(246): Parsed model-specific feature parameters from D:\Robot\sphin x\voxforge-ru-0.2\model_parameters\msu_ru_nsh.cd_cont_1000_8gau_16000/feat.param s INFO: fe_interface.c(299): You are using the internal mechanism to generate the seed. INFO: feat.c(713): Initializing feature stream to type: '1s_c_d_dd', ceplen=13, CMN='current', VARNORM='no', AGC='none' INFO: cmn.c(142): mean[0]= 12,00, mean[1..12]= 0.0 INFO: mdef.c(517): Reading model definition: D:\Robot\sphinx\voxforge-ru-0.2\mod el_parameters\msu_ru_nsh.cd_cont_1000_8gau_16000/mdef INFO: bin_mdef.c(179): Allocating 113108 * 8 bytes (883 KiB) for CD tree INFO: tmat.c(205): Reading HMM transition probability matrices: D:\Robot\sphinx\ voxforge-ru-0.2\model_parameters\msu_ru_nsh.cd_cont_1000_8gau_16000/transition_m atrices INFO: acmod.c(121): Attempting to use SCHMM computation module INFO: ms_gauden.c(198): Reading mixture gaussian parameter: D:\Robot\sphinx\voxf orge-ru-0.2\model_parameters\msu_ru_nsh.cd_cont_1000_8gau_16000/means INFO: ms_gauden.c(292): 1153 codebook, 1 feature, size: INFO: ms_gauden.c(294): 8x39 INFO: ms_gauden.c(198): Reading mixture gaussian parameter: D:\Robot\sphinx\voxf orge-ru-0.2\model_parameters\msu_ru_nsh.cd_cont_1000_8gau_16000/variances INFO: ms_gauden.c(292): 1153 codebook, 1 feature, size: INFO: ms_gauden.c(294): 8x39 INFO: ms_gauden.c(354): 879 variance values floored INFO: acmod.c(123): Attempting to use PTHMM computation module INFO: ms_gauden.c(198): Reading mixture gaussian parameter: D:\Robot\sphinx\voxf orge-ru-0.2\model_parameters\msu_ru_nsh.cd_cont_1000_8gau_16000/means INFO: ms_gauden.c(292): 1153 codebook, 1 feature, size: INFO: ms_gauden.c(294): 8x39 INFO: ms_gauden.c(198): Reading mixture gaussian parameter: D:\Robot\sphinx\voxf orge-ru-0.2\model_parameters\msu_ru_nsh.cd_cont_1000_8gau_16000/variances INFO: ms_gauden.c(292): 1153 codebook, 1 feature, size: INFO: ms_gauden.c(294): 8x39 INFO: ms_gauden.c(354): 879 variance values floored INFO: ptm_mgau.c(800): Number of codebooks exceeds 256: 1153 INFO: acmod.c(125): Falling back to general multi-stream GMM computation INFO: ms_gauden.c(198): Reading mixture gaussian parameter: D:\Robot\sphinx\voxf orge-ru-0.2\model_parameters\msu_ru_nsh.cd_cont_1000_8gau_16000/means INFO: ms_gauden.c(292): 1153 codebook, 1 feature, size: INFO: ms_gauden.c(294): 8x39 INFO: ms_gauden.c(198): Reading mixture gaussian parameter: D:\Robot\sphinx\voxf orge-ru-0.2\model_parameters\msu_ru_nsh.cd_cont_1000_8gau_16000/variances INFO: ms_gauden.c(292): 1153 codebook, 1 feature, size: INFO: ms_gauden.c(294): 8x39 INFO: ms_gauden.c(354): 879 variance values floored INFO: ms_senone.c(160): Reading senone mixture weights: D:\Robot\sphinx\voxforge -ru-0.2\model_parameters\msu_ru_nsh.cd_cont_1000_8gau_16000/mixture_weights INFO: ms_senone.c(211): Truncating senone logs3(pdf) values by 10 bits INFO: ms_senone.c(218): Not transposing mixture weights in memory INFO: ms_senone.c(277): Read mixture weights for 1153 senones: 1 features x 8 co dewords INFO: ms_senone.c(331): Mapping senones to individual codebooks INFO: ms_mgau.c(141): The value of topn: 4 INFO: dict.c(317): Allocating 190163 * 20 bytes (3714 KiB) for word entries INFO: dict.c(332): Reading main dictionary: D:\Robot\sphinx\voxforge-ru-0.2\etc\ msu_ru_nsh.dic INFO: dict.c(211): Allocated 3211 KiB for strings, 3214 KiB for phones INFO: dict.c(335): 186063 words read INFO: dict.c(341): Reading filler dictionary: D:\Robot\sphinx\voxforge-ru-0.2\et c\msu_ru_nsh.filler INFO: dict.c(211): Allocated 0 KiB for strings, 0 KiB for phones INFO: dict.c(344): 4 words read INFO: dict2pid.c(396): Building PID tables for dictionary INFO: dict2pid.c(404): Allocating 51^3 * 2 bytes (259 KiB) for word-initial trip hones INFO: dict2pid.c(131): Allocated 31416 bytes (30 KiB) for word-final triphones INFO: dict2pid.c(195): Allocated 31416 bytes (30 KiB) for single-phone word trip hones INFO: ngram_model_arpa.c(77): No \data\ mark in LM file INFO: ngram_model_dmp.c(142): Will use memory-mapped I/O for LM file INFO: ngram_model_dmp.c(196): ngrams 1=19941, 2=805517, 3=227533 INFO: ngram_model_dmp.c(242): 19941 = LM.unigrams(+trailer) read INFO: ngram_model_dmp.c(291): 805517 = LM.bigrams(+trailer) read INFO: ngram_model_dmp.c(317): 227533 = LM.trigrams read INFO: ngram_model_dmp.c(342): 12483 = LM.prob2 entries read INFO: ngram_model_dmp.c(362): 8800 = LM.bo_wt2 entries read INFO: ngram_model_dmp.c(382): 11407 = LM.prob3 entries read INFO: ngram_model_dmp.c(410): 1574 = LM.tseg_base entries read INFO: ngram_model_dmp.c(466): 19941 = ascii word strings read INFO: ngram_search_fwdtree.c(99): 859 unique initial diphones INFO: ngram_search_fwdtree.c(147): 0 root, 0 non-root channels, 18 single-phone words INFO: ngram_search_fwdtree.c(186): Creating search tree INFO: ngram_search_fwdtree.c(191): before: 0 root, 0 non-root channels, 18 singl e-phone words INFO: ngram_search_fwdtree.c(326): after: max nonroot chan increased to 44147 INFO: ngram_search_fwdtree.c(338): after: 610 root, 44019 non-root channels, 16 single-phone words INFO: ngram_search_fwdflat.c(156): fwdflat: min_ef_width = 4, max_sf_win = 25 INFO: continuous.c(378): D:\Robot\Sphinx3\code\pocketsphinx\bin\Release\pocketsp hinx_continuous.exe COMPILED ON: Nov 10 2012, AT: 21:27:06 Allocating 32 buffers of 2500 samples each READY.... Listening... Stopped listening, please wait... INFO: cmn_prior.c(121): cmn_prior_update: from < 8,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 > INFO: cmn_prior.c(139): cmn_prior_update: to < 12,90 0,51 -0,67 -0,12 -0,17 - 0,25 0,04 -0,23 -0,33 -0,12 -0,11 -0,13 -0,31 > INFO: ngram_search_fwdtree.c(1549): 2255 words recognized (5/fr) INFO: ngram_search_fwdtree.c(1551): 173494 senones evaluated (407/fr) INFO: ngram_search_fwdtree.c(1553): 366290 channels searched (859/fr), 122844 1st, 43168 last INFO: ngram_search_fwdtree.c(1557): 5845 words for which last channels evalu ated (13/fr) INFO: ngram_search_fwdtree.c(1560): 16198 candidate words for entering last p hone (38/fr) INFO: ngram_search_fwdtree.c(1562): fwdtree 0,89 CPU 0,209 xRT INFO: ngram_search_fwdtree.c(1565): fwdtree 5,12 wall 1,203 xRT INFO: ngram_search_fwdflat.c(305): Utterance vocabulary contains 55 words INFO: ngram_search_fwdflat.c(940): 2839 words recognized (7/fr) INFO: ngram_search_fwdflat.c(942): 76011 senones evaluated (178/fr) INFO: ngram_search_fwdflat.c(944): 118973 channels searched (279/fr) INFO: ngram_search_fwdflat.c(946): 13069 words searched (30/fr) INFO: ngram_search_fwdflat.c(948): 2142 word transitions (5/fr) INFO: ngram_search_fwdflat.c(951): fwdflat 0,19 CPU 0,044 xRT INFO: ngram_search_fwdflat.c(954): fwdflat 0,20 wall 0,047 xRT INFO: ngram_search.c(1214): </s> not found in last frame, using апре Р»СÐ.424 instead INFO: ngram_search.c(1266): lattice start node <s>.0 end node апрелСÐ.146 INFO: ngram_search.c(1294): Eliminated 2 nodes before end node INFO: ngram_search.c(1399): Lattice has 51 nodes, 6 links INFO: ps_lattice.c(1365): Normalizer P(O) = alpha(апрелСÐ:146:4 24) = -779488 INFO: ps_lattice.c(1403): Joint P(O,S) = -783871 P(S|O) = -4383 INFO: ngram_search.c(888): bestpath 0,02 CPU 0,004 xRT INFO: ngram_search.c(891): bestpath 0,07 wall 0,016 xRT 000000000: РЅР° апрелСРREADY.... sphinx 3 выдает что-то схожее но при этом ругается на словарь, который я брал последний зарелизеный тут https://sourceforge.net/projects/cmusphinx/...ian%20Voxforge/ ERROR: "wid.c", line 282: уле is not a word in dictionary and it is not a cla ss tag. ERROR: "wid.c", line 282: ули is not a word in dictionary and it is not a cla ss tag. ERROR: "wid.c", line 282: улю is not a word in dictionary and it is not a cla ss tag. ERROR: "wid.c", line 282: ÑƒÐ»Ñ is not a word in dictionary and it is not a cla ss tag. ERROR: "wid.c", line 282: уоткин is not a word in dictionary and it is not a class tag. ERROR: "wid.c", line 282: уоткина is not a word in dictionary and it is n ot a class tag. ERROR: "wid.c", line 282: уÑнхем is not a word in dictionary and it is not a class tag. ERROR: "wid.c", line 282: Ñ„ is not a word in dictionary and it is not a class t ag. ERROR: "wid.c", line 282: федоровича is not a word in dictionary and i t is not a class tag. ERROR: "wid.c", line 282: федоровичу is not a word in dictionary and i t is not a class tag. ERROR: "wid.c", line 282: фенбонг is not a word in dictionary and it is n ot a class tag. ERROR: "wid.c", line 282: феркин is not a word in dictionary and it is not a class tag. ERROR: "wid.c", line 282: филиппа is not a word in dictionary and it is n ot a class tag. ERROR: "wid.c", line 282: финк-ноттл is not a word in dictionary and it is not a class tag. ERROR: "wid.c", line 282: форд is not a word in dictionary and it is not a c lass tag. ERROR: "wid.c", line 282: фредерик is not a word in dictionary and it is not a class tag. ERROR: "wid.c", line 282: фриде is not a word in dictionary and it is not a class tag. ERROR: "wid.c", line 282: фридой is not a word in dictionary and it is not a class tag. ERROR: "wid.c", line 282: фриду is not a word in dictionary and it is not a class tag. ERROR: "wid.c", line 282: фриды is not a word in dictionary and it is not a class tag. ERROR: "wid.c", line 282: Ñ„Ñрн is not a word in dictionary and it is not a c lass tag. ERROR: "wid.c", line 282: Ñ… is not a word in dictionary and it is not a class t ag. ERROR: "wid.c", line 282: Ñ…Ð°Ð½Ñ is not a word in dictionary and it is not a c lass tag. ERROR: "wid.c", line 282: ханÑа is not a word in dictionary and it is not a class tag. ERROR: "wid.c", line 282: хацуми is not a word in dictionary and it is not a class tag. ERROR: "wid.c", line 282: хем is not a word in dictionary and it is not a cla ss tag. ERROR: "wid.c", line 282: Ñ…Ð¾Ñ€Ð¾ÐºÑ is not a word in dictionary and it is not a class tag. ERROR: "wid.c", line 282: храмом is not a word in dictionary and it is not a class tag. ERROR: "wid.c", line 282: хриÑтиана is not a word in dictionary and it is not a class tag. ERROR: "wid.c", line 282: хриÑтиану is not a word in dictionary and it is not a class tag. ERROR: "wid.c", line 282: хриÑтианы is not a word in dictionary and it is not a class tag. ERROR: "wid.c", line 282: хроно is not a word in dictionary and it is not a class tag. ERROR: "wid.c", line 282: Ñ…Ñмп is not a word in dictionary and it is not a c lass tag. ERROR: "wid.c", line 282: Ñ…Ñмфри is not a word in dictionary and it is not a class tag. ERROR: "wid.c", line 282: цветаев is not a word in dictionary and it is n ot a class tag. ERROR: "wid.c", line 282: центавра is not a word in dictionary and it is not a class tag. ERROR: "wid.c", line 282: цурукава is not a word in dictionary and it is not a class tag. ERROR: "wid.c", line 282: ч is not a word in dictionary and it is not a class t ag. ERROR: "wid.c", line 282: чили is not a word in dictionary and it is not a c lass tag. ERROR: "wid.c", line 282: чоппер is not a word in dictionary and it is not a class tag. ERROR: "wid.c", line 282: шарп is not a word in dictionary and it is not a c lass tag. ERROR: "wid.c", line 282: швейде is not a word in dictionary and it is not a class tag. ERROR: "wid.c", line 282: шекÑпира is not a word in dictionary and it is not a class tag. ERROR: "wid.c", line 282: шлюпок is not a word in dictionary and it is not a class tag. ERROR: "wid.c", line 282: шотландÑкого is not a word in dictionary a nd it is not a class tag. ERROR: "wid.c", line 282: штурмовик is not a word in dictionary and it is not a class tag. ERROR: "wid.c", line 282: шхуне is not a word in dictionary and it is not a class tag. ERROR: "wid.c", line 282: ще is not a word in dictionary and it is not a class tag. ERROR: "wid.c", line 282: ÑŒ is not a word in dictionary and it is not a class t ag. ERROR: "wid.c", line 282: Ñдик is not a word in dictionary and it is not a c lass tag. ERROR: "wid.c", line 282: Ñзра is not a word in dictionary and it is not a c lass tag. ERROR: "wid.c", line 282: Ñмили is not a word in dictionary and it is not a class tag. ERROR: "wid.c", line 282: Ñмилией is not a word in dictionary and it is n ot a class tag. ERROR: "wid.c", line 282: Ñмилии is not a word in dictionary and it is not a class tag. ERROR: "wid.c", line 282: Ñмилию is not a word in dictionary and it is not a class tag. ERROR: "wid.c", line 282: Ñмми is not a word in dictionary and it is not a c lass tag. ERROR: "wid.c", line 282: Ñритро is not a word in dictionary and it is not a class tag. ERROR: "wid.c", line 282: юджинии is not a word in dictionary and it is n ot a class tag. ERROR: "wid.c", line 282: юджинию is not a word in dictionary and it is n ot a class tag. ERROR: "wid.c", line 282: ÑŽÐ´Ð¶Ð¸Ð½Ð¸Ñ is not a word in dictionary and it is n ot a class tag. ERROR: "wid.c", line 282: ÑŽÑ‚ is not a word in dictionary and it is not a class tag. ERROR: "wid.c", line 282: Ñкопо is not a word in dictionary and it is not a class tag. ERROR: "wid.c", line 282: ÑÐ½ÑƒÑ is not a word in dictionary and it is not a c lass tag. ERROR: "wid.c", line 282: Ñхту is not a word in dictionary and it is not a c lass tag. INFO: wid.c(292): 535 LM words not in dictionary; ignored INFO: Initialization of fillpen_t, report: INFO: Language weight =9.500000 INFO: Word Insertion Penalty =0.700000 INFO: Silence probability =0.100000 INFO: Filler probability =0.100000 INFO: INFO: dict2pid.c(600): Building PID tables for dictionary INFO: Initialization of dict2pid_t, report: INFO: Dict2pid is in composite triphone mode INFO: 1523 composite states; 885 composite sseq INFO: INFO: kbcore.c(635): Inside kbcore: Verifying models consistency ...... INFO: kbcore.c(657): End of Initialization of Core Models: ERROR: "cmd_ln.c", line 942: Unknown argument: -debug INFO: Initialization of beam_t, report: INFO: Parameters used in Beam Pruning of Viterbi Search: INFO: Beam=-422203 INFO: PBeam=-383821 INFO: WBeam=-268675 (Skip=0) INFO: WEndBeam=-614114 INFO: No of CI Phone assumed=51 INFO: INFO: Initialization of fast_gmm_t, report: INFO: Parameters used in Fast GMM computation: INFO: Frame-level: Down Sampling Ratio 1, Conditional Down Sampling? 0, Dis tance-based Down Sampling? 0 INFO: GMM-level: CI phone beam -614114. MAX CD 100000 INFO: Gaussian-level: GS map would be used for Gaussian Selection? =1, SVQ wou ld be used as Gaussian Score? =0 SubVQ Beam -19366 INFO: INFO: Initialization of pl_t, report: INFO: Parameters used in phoneme lookahead: INFO: Phoneme look-ahead type = 0 INFO: Phoneme look-ahead beam size = -614114 INFO: No of CI Phones assumed=51 INFO: INFO: Initialization of ascr_t, report: INFO: No. of CI senone =153 INFO: No. of senone = 1153 INFO: No. of composite senone = 1523 INFO: No. of senone sequence = 4243 INFO: No. of composite senone sequence=885 INFO: Parameters used in phoneme lookahead: INFO: Phoneme lookahead window = 1 INFO: INFO: kb.c(308): SEARCH MODE INDEX 4 INFO: srch.c(376): Search Initialization. INFO: srch_time_switch_tree.c(285): -Nstalextree is omitted in TST search. INFO: lextree.c(225): Creating Unigram Table for lm (name: default) INFO: lextree.c(238): Size of word table after unigram + words in class: 19404. INFO: lextree.c(247): Size of word table after adding alternative prons: 19408. INFO: lextree_t, report: INFO: Parameters of the lexical tree. INFO: Type of the tree 0 (0:unigram, 1: 2g, 2: 3g etc.) INFO: Number of left contexts 39 INFO: Number of nodes 65069 INFO: Number of links in the tree 475809 INFO: The previous word for this tree INFO: The size of a node of the lexical tree 96 INFO: The size of a gnode_t 16 INFO: INFO: srch_time_switch_tree.c(345): Lextrees (0) for lm 0, its name is default, it has 65069 nodes(ug) INFO: lextree.c(225): Creating Unigram Table for lm (name: default) INFO: lextree.c(238): Size of word table after unigram + words in class: 19404. INFO: lextree.c(247): Size of word table after adding alternative prons: 19408. INFO: lextree_t, report: INFO: Parameters of the lexical tree. INFO: Type of the tree 0 (0:unigram, 1: 2g, 2: 3g etc.) INFO: Number of left contexts 39 INFO: Number of nodes 65069 INFO: Number of links in the tree 475809 INFO: The previous word for this tree INFO: The size of a node of the lexical tree 96 INFO: The size of a gnode_t 16 INFO: INFO: srch_time_switch_tree.c(345): Lextrees (1) for lm 0, its name is default, it has 65069 nodes(ug) INFO: lextree.c(225): Creating Unigram Table for lm (name: default) INFO: lextree.c(238): Size of word table after unigram + words in class: 19404. INFO: lextree.c(247): Size of word table after adding alternative prons: 19408. INFO: lextree_t, report: INFO: Parameters of the lexical tree. INFO: Type of the tree 0 (0:unigram, 1: 2g, 2: 3g etc.) INFO: Number of left contexts 39 INFO: Number of nodes 65069 INFO: Number of links in the tree 475809 INFO: The previous word for this tree INFO: The size of a node of the lexical tree 96 INFO: The size of a gnode_t 16 INFO: INFO: srch_time_switch_tree.c(345): Lextrees (2) for lm 0, its name is default, it has 65069 nodes(ug) INFO: srch_time_switch_tree.c(352): Time for building trees, 0.1404 CPU 0.1440 C lk INFO: srch_time_switch_tree.c(374): Lextrees(0), 2 nodes(filler) INFO: srch_time_switch_tree.c(374): Lextrees(1), 2 nodes(filler) INFO: srch_time_switch_tree.c(374): Lextrees(2), 2 nodes(filler) INFO: vithist.c(171): Initializing Viterbi-history module INFO: Initialization of srch_t, report: INFO: Operation Mode = 4, Operation Name = fwdtree INFO: INFO: s3_decode.c(261): Input data will NOT be byte swapped INFO: s3_decode.c(266): Partial hypothesis WILL be dumped INFO: fe_interface.c(299): You are using the internal mechanism to generate the seed. press ENTER to start recording press ENTER to finish recording Allocating 32 buffers of 2500 samples each .. Partial hypothesis: да . Partial hypothesis: во .. Partial hypothesis: жаль . Partial hypothesis: рай .. Partial hypothesis: тави . Partial hypothesis: тави .. Partial hypothesis: воем . Partial hypothesis: тави горе .. Partial hypothesis: тави Ð³Ð¾Ñ€Ñ .. Partial hypothesis: тави Ð³Ð¾Ñ€Ñ .. Partial hypothesis: моем вера .. Partial hypothesis: моем вера .. Partial hypothesis: моем вера . Partial hypothesis: тави горела .. Partial hypothesis: тави горела .. Partial hypothesis: тави горела . Partial hypothesis: моем вера .. Partial hypothesis: моем вера . Partial hypothesis: моем вера .. Partial hypothesis: моем вера конфигурация для обеих программ одинаковая, только pocketspinx через командную строку ввожу аргументы, а в sphinx 3 через конфигурационный файл. cfgfile.txt -samprate 16000 -hmm D:\Robot\sphinx\voxforge-ru-0.2\model_parameters\msu_ru_nsh.cd_cont_1000_8gau_16000 -dict D:\Robot\sphinx\voxforge-ru-0.2\etc\msu_ru_nsh.dic -fdict D:\Robot\sphinx\voxforge-ru-0.2\etc\msu_ru_nsh.filler -lm D:\Robot\sphinx\voxforge-ru-0.2\etc\msu_ru_nsh.lm.dmp Спасибо, что помогаете разобраться. |
Сообщ.
#9
,
|
|
|
Шрифт надо поставить lucida console.
|
Сообщ.
#10
,
|
|
|
Спасибо, долго мучился, решил встроить вывод в файл, все работает.
|