Первые шаги pocketsphinx -> Форум на Исходниках.Ру

	Наши проекты: Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту

Здравствуйте, Гость ! [216.73.216.14]

Модераторы: RaD, nsh

Новое голосование

Первые шаги pocketsphinx

paulboxer

Сообщ. #1 , 05.07.15, 12:30

Newbie

Профиль · PM

Рейтинг (т): нет

Хочу запустить примеры использования движка pocketshinx для Windows по инструкции на страничке http://cmusphinx.sourceforge.net/wiki/tutorialpocketsphinx

вот один из примеров использования
bin/Release/pocketsphinx_continuous.exe -infile test/data/goforward.raw -hmm model/en-us/en-us -lm model/en-us/en-us.lm.dmp -dict model/en-us/cmudict-en-us.dict
Когда я его запускаю программа выдает следующее: инф. во вложенном файле outConsole.txt

Как я понял ошибка в файле акустической модели, но файл mdef в папке model/en-us/en-us присутствует.

Кратко опишу что я делал с самого начала:
Я попытался скачать исходники Sphinxbase и Pocketsphinx с первых двух ссылок на этой страничке: http://cmusphinx.sourceforge.net/wiki/download&usg, но заметил странное обстоятельство, обе ссылки указывают на один и тот же архив Pocketsphinx, а архива с Sphinxbase там нету. Тогда я скачал Sphinxbase отсюда: https://github.com/cmusphinx/sphinxbase
далее по инструкции распаковал оба архива в одной папке и переименовал папки соответственно Sphinxbase и Pocketsphinx. Запустил Sln файлы в обоих и выполнил сборку в релизе.
Да еще при сборке pocketshinx VS2013 ругалось на отсутствие sphinxbase.lib тогда я его скопировал в
\pocketsphinx\win32\pocketsphinx\,
\pocketsphinx\win32\pocketsphinx_batch,
\pocketsphinx\win32\pocketsphinx_continuous
и проект собрался.
Подскажите в чем моя ошибка?
Прикреплённый файл

outConsole.txt (4,67 Кбайт, скачиваний: 423)

Сообщение отредактировано: paulboxer - 05.07.15, 12:48

paulboxer

Сообщ. #2 , 05.07.15, 15:05

Newbie

Профиль · PM

Рейтинг (т): нет

Получилось

нужно было просто прописывать полный путь...
цитата из мануала - Unlike on Linux, the path to the model is not preconfigured in Windows, so you have to specify pocketsphinx_continuous where to find the model with -hmm, -lm and -dict options. Change to pocketsphinx folder and run

А вот строка которая меня осчастливила
pocketsphinx_continuous.exe -infile c:/Users/admn2/Downloads/popitka3/pocketsphinx/test/data/goforward.raw -hmm c:/Users/admn2/Downloads/popitka3/pocketsphinx/model/en-us/en-us -lm c:/Users/admn2/Downloads/popitka3/pocketsphinx/model/en-us/en-us.lm.dmp -dict c:/Users/admn2/Downloads/popitka3/pocketsphinx/model/en-us/cmudict-en-us.dict

:lol:

kaup	Сообщ. #3 , 21.07.15, 12:44
Newbie Профиль · PM Рейтинг (т): нет	Не могу скачать движок pocketsphinx и документацию к нему. Выдает: The sourceforge.net website is temporarily in static offline mode. Only a very limited set of project pages are available until the main website returns to service. Если кто поделится, буду благодарен

zamir	Сообщ. #4 , 26.07.15, 14:59
Full Member Профиль · PM Поощрения: 1 Dgm Рейтинг (т): 9	https://github.com/cmusphinx/pocketsphinx

dito

Сообщ. #5 , 02.10.15, 05:39

Newbie

Профиль · PM

Рейтинг (т): нет

По примеру paulboxer собрал pocketsphinx для Windows. Если записываю файл и потом конвертирую его в формат 16000 Hz, 16 bit, то на выходе получаю весьма хороший результат. А вот если включаю распознавание напрямую с микрофона

pocketsphinx_continuous.exe -hmm c:\zero_ru.cd_cont_4000 -dict c:\ru.dic -lm c:\ru.lm -inmic yes

то результат абсолютно отрицательный, выводит полную ерунду. Прикреплённый файл

OutWave.txt (3,59 Кбайт, скачиваний: 484)
Подскажите новичку, что не так делаю?

nsh	Сообщ. #6 , 09.10.15, 07:03
Moderator Профиль · PM	Добавьте ключ -rawlogdir <dir>, pocketsphinx станет сохранять raw файлы. Выложите файлы для анализа или прослушайте самостоятельно в audacity, чтобы оценить качество записи с микрофона.

dito

Сообщ. #7 , 15.10.15, 06:38

Newbie

Профиль · PM

Рейтинг (т): нет

nsh, спасибо Вам, за то что помогаете! Купил на днях микрофон, качество распознавания значительно улучшилось, но все же оставляет желать лучшего. По Вашему совету добавил ключ -rawlogdir. Вот результаты:
- произносил в микрофон: Люблю грозу в начале мая Когда весенний первый гром Как бы резвяся и играя Грохочет в небе голубом.
- вот что получилось на выходе: Прикреплённый файл

test.txt (3,17 Кбайт, скачиваний: 416)
- вот raw файл (из-за размера пришлось конвертировать в mp3): Прикреплённый файл

000000000.mp3 (69,88 Кбайт, скачиваний: 716)

При прослушивании слышно, что в конце начались какие то сбои записи. Что не так делаю? Или может фраза слишком длинная? Да и еще, данная фраза распознавалась, после произношения секунд 20-25 (выдавались сообщения с пометкой INFO:, а уже потом результат), это нормально или можно ускорить процесс? Может есть возможность отключить вывод на экран этих самых сообщений с пометкой INFO:, или это не ускорит процесс распознавания?

И еще вопросик, хочу попробовать провести адаптацию акустической модели с официального сайта CMU Sphinx под названием zero_ru_cont_8k_v3, под свой голос. С какими параметрами проводить обучение 8000Hz или 16000Hz?

nsh

Сообщ. #8 , 16.10.15, 17:38

Moderator

Профиль · PM

Цитата

- вот raw файл (из-за размера пришлось конвертировать в mp3): Прикреплённый файлПрикреплённый файл000000000.mp3 (69,88 Кбайт, скачиваний: 8)

Преобразование в mp3 теряет данные. Вы можете выложить файл на Google Drive или Dropbox и дать здесь ссылку.

Цитата

При прослушивании слышно, что в конце начались какие то сбои записи. Что не так делаю? Или может фраза слишком длинная? Да и еще, данная фраза распознавалась, после произношения секунд 20-25 (выдавались сообщения с пометкой INFO:, а уже потом результат), это нормально или можно ускорить процесс? Может есть возможность отключить вывод на экран этих самых сообщений с пометкой INFO:, или это не ускорит процесс распознавания?

Скорее всего декодер стал пропускать запись из-за особенностей Windows и слишком медленной работы. Для быстрого декодирования лучше использовать модель PTM, не cont. Мы рекомендуем PTM по умолчанию.

Цитата

И еще вопросик, хочу попробовать провести адаптацию акустической модели с официального сайта CMU Sphinx под названием zero_ru_cont_8k_v3, под свой голос. С какими параметрами проводить обучение 8000Hz или 16000Hz?

Для zero_ru 8000.

1 пользователей читают эту тему (1 гостей и 0 скрытых пользователей)

0 пользователей:

[ Script execution time: 0,0243 ] [ 19 queries used ] [ Generated: 28.03.26, 09:35 GMT ]