
![]() |
Наши проекты:
Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту |
|
ПРАВИЛА | FAQ | Помощь | Поиск | Участники | Календарь | Избранное | RSS |
[216.73.216.30] |
![]() |
|
Страницы: (23) « Первая ... 14 15 [16] 17 18 ... 22 23 ( Перейти к последнему сообщению ) |
![]() |
Сообщ.
#226
,
|
|
Цитата 5. Если не получится, то мое внимание приковывает Сфинкс,какие у него ограничения по распознаванию речи- хотя бы 20 тысяч слов потянет? Потянет Цитата 6.Есть ли c#-обертки под pocketsphinks? Насколько я понял, необходимо сделать обертку,которая вызывает Си-шные библиотеки pocketsphinx-а?Через invoke,вроде. Это не сложно Цитата 7. pocketsphinx- диктороНЕзависимый? Да |
Сообщ.
#227
,
|
|
|
Не нашел подробной информации по такому вопросу:
Может ли CMU Sphinx работать в качестве сервиса? В таком случае, к нему могли бы подключаться клиенты, написанные на любом языке. Если да- можно ссылку на подробности? Спасибо. |
![]() |
Сообщ.
#228
,
|
|
Может, например, вот тут есть на node сервис:
https://github.com/cmusphinx/node-pocketsphinx вот тут на ruby: https://github.com/alumae/ruby-pocketsphinx-server |
Сообщ.
#229
,
|
|
|
Добрый вечер.
Только начинаю использовать cmu-sphinx, скачала версию pre-alpha5. Демо работают нормально, а вот при использовании русской модели из их репозитория возникла странная проблема. Использую LiveSpeechRecognizer. В момент, когда начинаю распознавание, всё зависает, минут через 10 вылезает GC overhead limit exceeded. Может кто-то сталкивался? Внятных рекомендаций найти не могу. Увеличить размер памяти для jvm не помогло. Если это важно, использую os x, sdk java 8. |
![]() |
Сообщ.
#230
,
|
|
Русская модель очень большая, чтобы её использовать нужно много памяти, которую можно выделить с помощью параметра java -Xmx, например -Xmx4096m
Для более быстрого декодирования с русской моделью можно использовать pocketsphinx. |
Сообщ.
#231
,
|
|
|
Цитата Однако во время исполнения NetBeans выдает ошибку Цитата java.lang.ArrayIndexOutOfBoundsException: 29 at edu.cmu.sphinx.linguist.acoustic.tiedstate.MixtureComponent.getScore(MixtureComponent.java:195) at edu.cmu.sphinx.linguist.acoustic.tiedstate.GaussianMixture.calculateScore(Gaussian Здравствуйте, у меня такая же ошибка, видел что отправляют читать мануал, читал не нашел как исправить. Получилось так, испытывал приложение HelloWorld со словарем zero_ru_cont_8k_v3, но т.к. мне все слова заведенные в файл ru.dic не нужны, решил уменьшить, вероятно сделал это неправильно, но теперь программа выдает эту ошибку. Пишу под jawa работаю в Netbeans. Пожалуйста не судите строго за сумбурное изложение, помогите разобраться. |
![]() |
Сообщ.
#232
,
|
|
Цитата Пожалуйста не судите строго за сумбурное изложение, помогите разобраться. Как разбираться-то, если Вы не удосужились никакой информации предоставить? Телепатов среди нас нет. Проект нужно выложить, или хотя бы описать его структуру, код показать. |
Сообщ.
#233
,
|
|
|
Спасибо за быстрый ответ,
файлы проекта и настроек прикрепил Прикреплённый файл ![]() |
Сообщ.
#234
,
|
|
|
Дополню вопрос,
Используется pocketshinx4, zero_ru.cd_cont_4000. Качество и скорость распознавания вполне устраивают. Но все таки хотелось бы увеличить скорость. На что стоит сделать упор, на процессоре или на памяти, что является бутылочным горлышком? Сейчас схема работает в тестовом режиме, т.е. массовости распознавания нет, речь идет пока только про тестовый контур. |
![]() |
Сообщ.
#235
,
|
|
Цитата SAndrusReg @ файлы проекта и настроек прикрепил Вы используете устаревшую версию sphinx4. Для наилучшего распознавания используйте последнюю версию sphinx4-5prealpha, как описано в руководстве http://cmusphinx.sourceforge.net/wiki/tutorialsphinx4 Добавлено Цитата Zusrut @ отсюда вопрос как запустить сфинкса в режиме ожидания - чтобы он держал все параметры загруженными и только ждал когда ему подкинут wav файлик? Использовать программный интерфейс pocketsphinx, например, на python: https://github.com/cmusphinx/pocketsphinx/b...decoder_test.py Добавлено Цитата AlexeyMish @ На что стоит сделать упор, на процессоре или на памяти, что является бутылочным горлышком? Вообще ptm модели гораздо быстрее, чем cont. Если нужна производительность лучше использовать их. На заданный вопрос лучше всего ответит профиль системы, собрать его можно с помощью oprofile/operf. |
Сообщ.
#236
,
|
|
|
Спасибо, вообще-то я был уверен что использую эту версию. Сейчас все проверю.
|
Сообщ.
#237
,
|
|
|
Добрый день!
Как лучше всего будет реализовать массовое распознавание речи на разных языках? Думаю на каждый язык распознавания инициализировать свой ps_decoder_t и выделять отдельный поток, в ктором будут идти блокирующие обращения к pd_decode_raw(). Или лучше иметь один декодер и при смене языка распознавания вызывать ps_init() для реинициализации декодера и всю работу организовать в единственном потоке? Понимаю, что в первом случае потребуется очень много памяти, однако должен быть выигрыш в скорости на многоядерных установках? Правильный ли ход мыслей? Заранее благодарен за советы и критику ![]() |
![]() |
Сообщ.
#238
,
|
|
Цитата Думаю на каждый язык распознавания инициализировать свой ps_decoder_t и выделять отдельный поток, в ктором будут идти блокирующие обращения к pd_decode_raw(). Так лучше. |
Сообщ.
#239
,
|
|
|
Здравствуйте,
пытаюсь запустить демонстрацию DialogDemo из prbSphinx4-5prealpha. Инициализирую переменные так: private static final String ACOUSTIC_MODEL = "resource:/AcousticModels/model_parameters/msu_ru_nsh.cd_cont_1000_8gau_16000"; private static final String DICTIONARY_PATH = "resource:/AcousticModels/etc/msu_ru_nsh.dic"; private static final String GRAMMAR_PATH = "resource:/edu/cmu/sphinx/demo/dialog/"; private static final String LANGUAGE_MODEL = "resource:/AcousticModels/etc/msu_ru_nsh.lm.dmp"; при выполнении получаю ошибку: Exception in thread "main" java.lang.IllegalStateException: javax.sound.sampled.LineUnavailableException: line with format PCM_SIGNED 16000.0 Hz, 16 bit, mono, 2 bytes/frame, little-endian not supported. at edu.cmu.sphinx.api.Microphone.<init>(Microphone.java:38) at edu.cmu.sphinx.api.SpeechSourceProvider.getMicrophone(SpeechSourceProvider.java:18) at edu.cmu.sphinx.api.LiveSpeechRecognizer.<init>(LiveSpeechRecognizer.java:34) at edu.cmu.sphinx.demo.dialog.DialogDemo.main(DialogDemo.java:144) Caused by: javax.sound.sampled.LineUnavailableException: line with format PCM_SIGNED 16000.0 Hz, 16 bit, mono, 2 bytes/frame, little-endian not supported. at com.sun.media.sound.DirectAudioDevice$DirectDL.implOpen(DirectAudioDevice.java:513) at com.sun.media.sound.AbstractDataLine.open(AbstractDataLine.java:121) Подскажите пожалуйста с чем это может быть связано. Спасибо. Добавлено У Вас получилось исправить ошибку? |
Сообщ.
#240
,
|
|
|
И почему, если использовать микрофон так:
Microphone microphone = (Microphone)cm.lookup("microphone"); if(!microphone.startRecording()){} то ошибки не возникает. |