Работа с CMU Sphinx -> Форум на Исходниках.Ру

	Наши проекты: Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту

Здравствуйте, Гость ! [3.149.255.162]

Модераторы: RaD, nsh

Новое голосование

Работа с CMU Sphinx , Работа с CMU Sphinx 4.0

VMerk	Сообщ. #301 , 24.01.17, 08:14
Newbie Профиль · PM Рейтинг (т): нет	Вот сами записи: https://yadi.sk/d/oXsrB6er3Abv7M

nsh	Сообщ. #302 , 24.01.17, 16:21
Moderator Профиль · PM	Для bw нужно добавить -lda cmusphinx-ru-5.2/feature_transform, это в документации указано. Для уверенного распознавания нужно микрофон хороший.

VMerk	Сообщ. #303 , 24.01.17, 21:44
Newbie Профиль · PM Рейтинг (т): нет	Цитата Для bw нужно добавить -lda cmusphinx-ru-5.2/feature_transform, это в документации указано. Да, всё классно, это исправило ситуацию. Спасибо большое! Буду пробовать

ivan_007	Сообщ. #304 , 11.02.17, 10:42
Newbie Профиль · PM Рейтинг (т): нет	Развернул библиотеку распознавания sphinx в программе на C#. Привет, как вывести в окно программы процент распознавания, ошибок, если я использую словарь JSpeech Grammar Format (JSGF)? Программа реализована на C#.

Kenait

Сообщ. #305 , 23.05.17, 22:24

Newbie

Профиль · PM

Рейтинг (т): нет

Добрый вечер.
Пытаюсь разобраться как работает pocketsphinx. На официальном сайте хорошо описано как с ним работать, но практически не описана его архитектура, используемые алгоритмы. Искал в интернете, но нашел только статью про сфинкс-4. Есть ли похожая про pocketsphinx, и если нет то где можно узнать архитектуру и используемые алгоритмы. Насколько сильно pocketsphinx в этом пересекается с sphinx-4?

Статья - http://egouvea.users.sourceforge.net/paper...tr-2004-139.pdf

Сообщение отредактировано: Kenait - 23.05.17, 22:25

nsh	Сообщ. #306 , 23.05.17, 23:08
Moderator Профиль · PM	http://www.cs.cmu.edu/~dhuggins/Publicatio...ocketsphinx.pdf https://www.lti.cs.cmu.edu/sites/default/fi...recognition.pdf http://www.cs.cmu.edu/~rkm/th/th.pdf

Kenait

Сообщ. #307 , 24.05.17, 11:27

Newbie

Профиль · PM

Рейтинг (т): нет

Спасибо, то что нужно. Другой вопрос - есть ли способы редактировать словарь кроме как вручную? Я создаю простую программу - "органайзер", которая будет записывать запланированные мероприятия, и слишком большой словарь только снизит точность. Имеет ли смысл искать способы урезать уже готовый или стоит создать новый словарь для моей программы?

nsh

Сообщ. #308 , 24.05.17, 13:34

Moderator

Профиль · PM

Цитата Kenait @ 24.05.17, 11:27

Другой вопрос - есть ли способы редактировать словарь кроме как вручную? Я создаю простую программу - "органайзер", которая будет записывать запланированные мероприятия, и слишком большой словарь только снизит точность. Имеет ли смысл искать способы урезать уже готовый или стоит создать новый словарь для моей программы?

Словарь редактировать плохая идея, нужно редактировать модель языка, например, грамматику. А словарь лучше оставить как есть.

Kenait

Сообщ. #309 , 24.05.17, 13:50

Newbie

Профиль · PM

Рейтинг (т): нет

Спасибо за ответ. Я создал грамматику для ввода даты мероприятия, но хотел оставить свободную речь для описания самого мероприятия. Так или иначе пока что просто буду работать по туториалу - в последних главах как раз рассматривается вопрос точности.

Kenait

Сообщ. #310 , 26.05.17, 16:52

Newbie

Профиль · PM

Рейтинг (т): нет

Снова возник вопрос.
Я распознаю речь с микрофона, который пишет на 48000 гц. Как я понимаю это может понизить точность распознавания. В этой теме упоминалось что необходимо ввести в параметрах -samprate 48000, однако если я делаю такую настройку выводится ошибка:
ERROR: "fe_interface.c", line 105: FFT: Number of points must be greater or equal to frame size (1230 samples)

nsh

Сообщ. #311 , 26.05.17, 20:10

Moderator

Профиль · PM

Цитата Kenait @ 26.05.17, 16:52

Нужно nfft указать

-samprate 48000 -nfft 2048

Лучше драйвер настроить чтобы частоту дискретизации изменял самостоятельно.

Kenait

Сообщ. #312 , 29.05.17, 18:42

Newbie

Профиль · PM

Рейтинг (т): нет

На данный момент я тестирую точность распознавания и у меня возник вопрос - в туториале советуется после проведения теста использовать скрипт word_align.pl. Как это точно сделать? Если я правильно понял то нужно после выполнения тестирования ввести в командную строку файл скрипта, затем файл транскрипции, затем файл гипотезы. Но вместо работы скрипта у меня просто выводит его текст в блокноте. Что я делаю не так?

nsh	Сообщ. #313 , 30.05.17, 11:22
Moderator Профиль · PM	Цитата Kenait @ 29.05.17, 18:42 Что я делаю не так? Windows используете.

Kenait

Сообщ. #314 , 30.05.17, 14:57

Newbie

Профиль · PM

Рейтинг (т): нет

Я установил perl, и теперь при запуске команды C:\Users\User>"E:\CMU Sphinx\sphinxtrain\scripts\decode\word_align.pl" "E:\CMU Sphinx\pocketsphinx\bin\Release\Win32\wav\arctic20.transcription" "E:\CMU Sphinx\pocketsphinx\bin\Release\Win32\wav\arctic20.hyp"
получаю на выходе строку:
Usage:
word_align [options] reference_file hypothesis_file

Сообщение отредактировано: Kenait - 30.05.17, 15:14

Kenait

Сообщ. #315 , 02.06.17, 09:06

Newbie

Профиль · PM

Рейтинг (т): нет

После проведения адаптации акустической модели результаты распознавания только ухудшились. Относится ли это к использованию русской языковой модели, или я провел адаптацию неправильно? Проверку провел на наборе данных, который использовал при адаптации. Как я понял точность распознавания должна была резко возрасти, но вместо этого ухудшилась.

0 пользователей читают эту тему (0 гостей и 0 скрытых пользователей)

0 пользователей:

Страницы: (23) « Первая ... 19 20 [21] 22 23

[ Script execution time: 0,0464 ] [ 16 queries used ] [ Generated: 25.04.24, 05:02 GMT ]