Работа с CMU Sphinx -> Форум на Исходниках.Ру

	Наши проекты: Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту

Здравствуйте, Гость ! [216.73.216.43]

Дорогие друзья! Поздравляем вас с наступающим Новым 2026 годом!

Всем удачи, успеха и благополучия!

Модераторы: RaD, nsh

Новое голосование

Работа с CMU Sphinx , Работа с CMU Sphinx 4.0

nsh

Сообщ. #226 , 16.04.15, 19:52

Moderator

Профиль · PM

Цитата

5. Если не получится, то мое внимание приковывает Сфинкс,какие у него ограничения по распознаванию речи- хотя бы 20 тысяч слов потянет?

Потянет

Цитата

6.Есть ли c#-обертки под pocketsphinks? Насколько я понял, необходимо сделать обертку,которая вызывает Си-шные библиотеки pocketsphinx-а?Через invoke,вроде.

Это не сложно

Цитата

7. pocketsphinx- диктороНЕзависимый?

Да

Simplevolk

Сообщ. #227 , 20.04.15, 07:50

Newbie

Профиль · PM

Рейтинг (т): нет

Не нашел подробной информации по такому вопросу:

Может ли CMU Sphinx работать в качестве сервиса? В таком случае, к нему могли бы подключаться клиенты, написанные на любом языке.

Если да- можно ссылку на подробности?

Спасибо.

nsh	Сообщ. #228 , 20.04.15, 18:06
Moderator Профиль · PM	Может, например, вот тут есть на node сервис: https://github.com/cmusphinx/node-pocketsphinx вот тут на ruby: https://github.com/alumae/ruby-pocketsphinx-server

mirl

Сообщ. #229 , 31.05.15, 17:29

Newbie

Профиль · PM

Рейтинг (т): нет

Добрый вечер.
Только начинаю использовать cmu-sphinx, скачала версию pre-alpha5. Демо работают нормально, а вот при использовании русской модели из их репозитория возникла странная проблема.
Использую LiveSpeechRecognizer.
В момент, когда начинаю распознавание, всё зависает, минут через 10 вылезает GC overhead limit exceeded.
Может кто-то сталкивался?
Внятных рекомендаций найти не могу. Увеличить размер памяти для jvm не помогло.
Если это важно, использую os x, sdk java 8.

nsh	Сообщ. #230 , 01.06.15, 09:32
Moderator Профиль · PM	Русская модель очень большая, чтобы её использовать нужно много памяти, которую можно выделить с помощью параметра java -Xmx, например -Xmx4096m Для более быстрого декодирования с русской моделью можно использовать pocketsphinx.

SAndrusReg

Сообщ. #231 , 25.06.15, 12:49

Newbie

Профиль · PM

Рейтинг (т): нет

Цитата

Однако во время исполнения NetBeans выдает ошибку
Цитата
java.lang.ArrayIndexOutOfBoundsException: 29
at edu.cmu.sphinx.linguist.acoustic.tiedstate.MixtureComponent.getScore(MixtureComponent.java:195)
at edu.cmu.sphinx.linguist.acoustic.tiedstate.GaussianMixture.calculateScore(Gaussian

Здравствуйте, у меня такая же ошибка, видел что отправляют читать мануал, читал не нашел как исправить.
Получилось так, испытывал приложение HelloWorld со словарем zero_ru_cont_8k_v3, но т.к. мне все слова
заведенные в файл ru.dic не нужны, решил уменьшить, вероятно сделал это неправильно, но теперь
программа выдает эту ошибку.
Пишу под jawa работаю в Netbeans.
Пожалуйста не судите строго за сумбурное изложение, помогите разобраться.

nsh

Сообщ. #232 , 27.06.15, 10:30

Moderator

Профиль · PM

Цитата

Пожалуйста не судите строго за сумбурное изложение, помогите разобраться.

Как разбираться-то, если Вы не удосужились никакой информации предоставить? Телепатов среди нас нет. Проект нужно выложить, или хотя бы описать его структуру, код показать.

SAndrusReg	Сообщ. #233 , 29.06.15, 07:23
Newbie Профиль · PM Рейтинг (т): нет	Спасибо за быстрый ответ, файлы проекта и настроек прикрепил Прикреплённый файлprbsphinx.zip (3,11 Кбайт, скачиваний: 161)

AlexeyMish

Сообщ. #234 , 29.06.15, 08:50

Newbie

Профиль · PM

Рейтинг (т): нет

Дополню вопрос,
Используется pocketshinx4, zero_ru.cd_cont_4000.
Качество и скорость распознавания вполне устраивают.
Но все таки хотелось бы увеличить скорость. На что стоит сделать упор, на процессоре или на памяти, что является бутылочным горлышком?
Сейчас схема работает в тестовом режиме, т.е. массовости распознавания нет, речь идет пока только про тестовый контур.

nsh

Сообщ. #235 , 29.06.15, 16:08

Moderator

Профиль · PM

Цитата SAndrusReg @ 29.06.15, 07:23

файлы проекта и настроек прикрепил

Вы используете устаревшую версию sphinx4. Для наилучшего распознавания используйте последнюю версию sphinx4-5prealpha, как описано в руководстве

http://cmusphinx.sourceforge.net/wiki/tutorialsphinx4

Добавлено 29.06.15, 16:11

Цитата Zusrut @ 29.06.15, 08:36

отсюда вопрос как запустить сфинкса в режиме ожидания - чтобы он держал все параметры загруженными и только ждал когда ему подкинут wav файлик?

Использовать программный интерфейс pocketsphinx, например, на python:

https://github.com/cmusphinx/pocketsphinx/b...decoder_test.py

Добавлено 29.06.15, 16:13

Цитата AlexeyMish @ 29.06.15, 08:50

На что стоит сделать упор, на процессоре или на памяти, что является бутылочным горлышком?

Вообще ptm модели гораздо быстрее, чем cont. Если нужна производительность лучше использовать их.

На заданный вопрос лучше всего ответит профиль системы, собрать его можно с помощью oprofile/operf.

SAndrusReg	Сообщ. #236 , 30.06.15, 08:11
Newbie Профиль · PM Рейтинг (т): нет	Спасибо, вообще-то я был уверен что использую эту версию. Сейчас все проверю.

i7achi

Сообщ. #237 , 10.07.15, 16:32

Newbie

Профиль · PM

Рейтинг (т): нет

Добрый день!
Как лучше всего будет реализовать массовое распознавание речи на разных языках? Думаю на каждый язык распознавания инициализировать свой ps_decoder_t и выделять отдельный поток, в ктором будут идти блокирующие обращения к pd_decode_raw().
Или лучше иметь один декодер и при смене языка распознавания вызывать ps_init() для реинициализации декодера и всю работу организовать в единственном потоке?
Понимаю, что в первом случае потребуется очень много памяти, однако должен быть выигрыш в скорости на многоядерных установках?
Правильный ли ход мыслей? Заранее благодарен за советы и критику

Сообщение отредактировано: i7achi - 10.07.15, 16:34

nsh	Сообщ. #238 , 11.07.15, 08:19
Moderator Профиль · PM	Цитата Думаю на каждый язык распознавания инициализировать свой ps_decoder_t и выделять отдельный поток, в ктором будут идти блокирующие обращения к pd_decode_raw(). Так лучше.

SAndrusReg

Сообщ. #239 , 15.07.15, 06:07

Newbie

Профиль · PM

Рейтинг (т): нет

Здравствуйте,
пытаюсь запустить демонстрацию DialogDemo из prbSphinx4-5prealpha.

Инициализирую переменные так:
private static final String ACOUSTIC_MODEL =
"resource:/AcousticModels/model_parameters/msu_ru_nsh.cd_cont_1000_8gau_16000";
private static final String DICTIONARY_PATH =
"resource:/AcousticModels/etc/msu_ru_nsh.dic";
private static final String GRAMMAR_PATH =
"resource:/edu/cmu/sphinx/demo/dialog/";
private static final String LANGUAGE_MODEL =
"resource:/AcousticModels/etc/msu_ru_nsh.lm.dmp";

при выполнении получаю ошибку:
Exception in thread "main" java.lang.IllegalStateException: javax.sound.sampled.LineUnavailableException: line with format PCM_SIGNED 16000.0 Hz, 16 bit, mono, 2 bytes/frame, little-endian not supported.
at edu.cmu.sphinx.api.Microphone.<init>(Microphone.java:38)
at edu.cmu.sphinx.api.SpeechSourceProvider.getMicrophone(SpeechSourceProvider.java:18)
at edu.cmu.sphinx.api.LiveSpeechRecognizer.<init>(LiveSpeechRecognizer.java:34)
at edu.cmu.sphinx.demo.dialog.DialogDemo.main(DialogDemo.java:144)
Caused by: javax.sound.sampled.LineUnavailableException: line with format PCM_SIGNED 16000.0 Hz, 16 bit, mono, 2 bytes/frame, little-endian not supported.
at com.sun.media.sound.DirectAudioDevice$DirectDL.implOpen(DirectAudioDevice.java:513)
at com.sun.media.sound.AbstractDataLine.open(AbstractDataLine.java:121)
Подскажите пожалуйста с чем это может быть связано.
Спасибо.

Добавлено 15.07.15, 06:51

Цитата Young @ 13.08.14, 12:31

учту, спасибо

У Вас получилось исправить ошибку?

SAndrusReg	Сообщ. #240 , 15.07.15, 07:21
Newbie Профиль · PM Рейтинг (т): нет	И почему, если использовать микрофон так: Microphone microphone = (Microphone)cm.lookup("microphone"); if(!microphone.startRecording()){} то ошибки не возникает.

0 пользователей читают эту тему (0 гостей и 0 скрытых пользователей)

0 пользователей:

Страницы: (23) « Первая ... 14 15 [16] 17 18 ... 22 23

[ Script execution time: 0,0672 ] [ 17 queries used ] [ Generated: 31.12.25, 05:21 GMT ]