Автоматизация определения(распознавания) дефектов в произношении -> Форум на Исходниках.Ру

	Наши проекты: Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту

Здравствуйте, Гость ! [18.219.213.27]

Модераторы: RaD, nsh

Новое голосование

Автоматизация определения(распознавания) дефектов в произношении

malkond

Сообщ. #1 , 13.03.14, 16:15

Newbie

Профиль · PM

Рейтинг (т): нет

Здравствуйте.
Прошу подсказки, совета или помощи.
Задача такая: Дипломная работа на тему распознавание дефектов в произношении.
Описание: нередко кто в детстве сталкивался с логопедом. Его задача определить все дефекты в речи и назначить упражнения по ее коррекции.
Задача состоит в автоматизации распознавания этих дефектов путем сравнения эталонного произношения с произнесенным через микрофон и сообщение какие дефекты есть.
Проблема с алгоритмами или методами сравнения эталонного и произнесенного.
Нужно разбить звуковой файл на фонемы, сравнить их количество(есть такой дефект пропускания букв)
проверить похожи ли те звуки(который в данный момент проверяется)на созвучные, например б-п, д-т и т.д. (дефект замены одного звука другим)
и в конце проверить насколько звук искажен(или просто определить процент искажения звука и если он искажен предположим на более чем 10% считать это дефектом).

Подскажите, какие методы или алгоритмы можно(лучше) использовать для этого?

nsh

Сообщ. #2 , 14.03.14, 07:44

Moderator

Профиль · PM

Поздновато начинать дипломную работу. Тем более без руководителя. Литературу по определению недостатков речи можно найти в google по ключевым словам "disfluency detection" это обширная тема. Например можно начать с http://research.microsoft.com/apps/pubs/de....aspx?id=193166

В короткий срок по disfluency detection можно сделать только определение несложных замен звуков как с и ш. Сделать это можно с помощью моделей CMUSphinx, просто написать грамматику вариантов и составить словарь.

Сообщение отредактировано: nsh - 14.03.14, 07:45

malkond	Сообщ. #3 , 14.03.14, 08:06
Newbie Профиль · PM Рейтинг (т): нет	Цитата nsh @ 14.03.14, 07:44 это не в короткий срок)) это еще полтора года) Добавлено 14.03.14, 08:08 А на счет ключевых слов, спасибо. я пыталась найти по другим словам. и у меня выходило всего пара статей.

malkond	Сообщ. #4 , 14.03.14, 09:05
Newbie Профиль · PM Рейтинг (т): нет	И все-таки это не про то. имею ввиду "disfluency detection". по нему нашла только статьи со словами паразитами типа: ммм, эм, гм.. тд. но вон ту модель можно попробовать применить

nsh

Сообщ. #5 , 21.03.14, 20:09

Moderator

Профиль · PM

Цитата

это не в короткий срок)) это еще полтора года)

А, ну здорово, тогда можно развернуться.

Цитата

по нему нашла только статьи со словами паразитами типа: ммм, эм, гм.. тд. но вон ту модель можно попробовать применить

Ссылок можно много найти. Держите в курсе успехов.

malkond

Сообщ. #6 , 22.03.14, 17:09

Newbie

Профиль · PM

Рейтинг (т): нет

Цитата nsh @ 21.03.14, 20:09

Цитата

это не в короткий срок)) это еще полтора года)

А, ну здорово, тогда можно развернуться.

Цитата

Ссылок можно много найти. Держите в курсе успехов.

Скажите, а будет ли возможным распознавание тех же дефектов с помощью MFCC + DTW? просто в одной их тем, тут на форему, данный "алгоритм" используется для подобного Распознавание отдельных слов.

Добавлено 22.03.14, 17:44
и еще вопрос. Есть ли какие нибудь алгоритмы или вообще где-нибудь записано как вообще составлять свою грамматику и словарь для CMUSphinx?

nsh

Сообщ. #7 , 22.03.14, 21:20

Moderator

Профиль · PM

Цитата

Да, возможно.

Цитата

и еще вопрос. Есть ли какие нибудь алгоритмы или вообще где-нибудь записано как вообще составлять свою грамматику и словарь для CMUSphinx?

Описание грамматики для CMUSphinx можно найти тут:

http://www.w3.org/TR/2000/NOTE-jsgf-20000605/

Документацию по работе с CMUSphinx можно найти тут:

http://cmusphinx.sourceforge.net/wiki/tutorial

antonsrv8

Сообщ. #8 , 24.03.14, 10:08

Member

Профиль · PM

Рейтинг (т): 2

"Скажите, а будет ли возможным распознавание тех же дефектов с помощью MFCC + DTW? просто в одной их тем, тут на форему, данный "алгоритм" используется для подобного Распознавание отдельных слов. "

Вряд ли Вы сможете ограничится использованием готовых методов. Основная работа - сбор базы данных дефектов речи и выявление специальных признаков, присущих им. Во-первых, людей с дефектами нужно набрать побольше (на мой взгляд, не меньше 10 на каждый дефект). Во-вторых, многие дефекты могут быть связаны с временнЫми параметрами, которые DTW попытается сгладить.

malkond

Сообщ. #9 , 24.03.14, 13:26

Newbie

Профиль · PM

Рейтинг (т): нет

Цитата antonsrv8 @ 24.03.14, 10:08

Хм, спасибо учту, но над самой программой буду работать позже. где то с сентября или чуть раньше. сейчас мне эта информация больше на статью нужна и для проектирования программы

1 пользователей читают эту тему (1 гостей и 0 скрытых пользователей)

0 пользователей:

[ Script execution time: 0,0275 ] [ 14 queries used ] [ Generated: 20.05.24, 10:16 GMT ]