Наши проекты:
Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту |
||
ПРАВИЛА | FAQ | Помощь | Поиск | Участники | Календарь | Избранное | RSS |
[34.231.180.210] |
|
Сообщ.
#1
,
|
|
|
Здравствуйте.
Прошу подсказки, совета или помощи. Задача такая: Дипломная работа на тему распознавание дефектов в произношении. Описание: нередко кто в детстве сталкивался с логопедом. Его задача определить все дефекты в речи и назначить упражнения по ее коррекции. Задача состоит в автоматизации распознавания этих дефектов путем сравнения эталонного произношения с произнесенным через микрофон и сообщение какие дефекты есть. Проблема с алгоритмами или методами сравнения эталонного и произнесенного. Нужно разбить звуковой файл на фонемы, сравнить их количество(есть такой дефект пропускания букв) проверить похожи ли те звуки(который в данный момент проверяется)на созвучные, например б-п, д-т и т.д. (дефект замены одного звука другим) и в конце проверить насколько звук искажен(или просто определить процент искажения звука и если он искажен предположим на более чем 10% считать это дефектом). Подскажите, какие методы или алгоритмы можно(лучше) использовать для этого? |
Сообщ.
#2
,
|
|
|
Поздновато начинать дипломную работу. Тем более без руководителя. Литературу по определению недостатков речи можно найти в google по ключевым словам "disfluency detection" это обширная тема. Например можно начать с http://research.microsoft.com/apps/pubs/de....aspx?id=193166
В короткий срок по disfluency detection можно сделать только определение несложных замен звуков как с и ш. Сделать это можно с помощью моделей CMUSphinx, просто написать грамматику вариантов и составить словарь. |
Сообщ.
#3
,
|
|
|
Цитата nsh @ это не в короткий срок)) это еще полтора года) Добавлено А на счет ключевых слов, спасибо. я пыталась найти по другим словам. и у меня выходило всего пара статей. |
Сообщ.
#4
,
|
|
|
И все-таки это не про то. имею ввиду "disfluency detection". по нему нашла только статьи со словами паразитами типа: ммм, эм, гм.. тд. но вон ту модель можно попробовать применить
|
Сообщ.
#5
,
|
|
|
Цитата это не в короткий срок)) это еще полтора года) А, ну здорово, тогда можно развернуться. Цитата по нему нашла только статьи со словами паразитами типа: ммм, эм, гм.. тд. но вон ту модель можно попробовать применить Ссылок можно много найти. Держите в курсе успехов. |
Сообщ.
#6
,
|
|
|
Цитата nsh @ Цитата это не в короткий срок)) это еще полтора года) А, ну здорово, тогда можно развернуться. Цитата по нему нашла только статьи со словами паразитами типа: ммм, эм, гм.. тд. но вон ту модель можно попробовать применить Ссылок можно много найти. Держите в курсе успехов. Скажите, а будет ли возможным распознавание тех же дефектов с помощью MFCC + DTW? просто в одной их тем, тут на форему, данный "алгоритм" используется для подобного Распознавание отдельных слов. Добавлено и еще вопрос. Есть ли какие нибудь алгоритмы или вообще где-нибудь записано как вообще составлять свою грамматику и словарь для CMUSphinx? |
Сообщ.
#7
,
|
|
|
Цитата Скажите, а будет ли возможным распознавание тех же дефектов с помощью MFCC + DTW? просто в одной их тем, тут на форему, данный "алгоритм" используется для подобного Распознавание отдельных слов. Да, возможно. Цитата и еще вопрос. Есть ли какие нибудь алгоритмы или вообще где-нибудь записано как вообще составлять свою грамматику и словарь для CMUSphinx? Описание грамматики для CMUSphinx можно найти тут: http://www.w3.org/TR/2000/NOTE-jsgf-20000605/ Документацию по работе с CMUSphinx можно найти тут: http://cmusphinx.sourceforge.net/wiki/tutorial |
Сообщ.
#8
,
|
|
|
"Скажите, а будет ли возможным распознавание тех же дефектов с помощью MFCC + DTW? просто в одной их тем, тут на форему, данный "алгоритм" используется для подобного Распознавание отдельных слов. "
Вряд ли Вы сможете ограничится использованием готовых методов. Основная работа - сбор базы данных дефектов речи и выявление специальных признаков, присущих им. Во-первых, людей с дефектами нужно набрать побольше (на мой взгляд, не меньше 10 на каждый дефект). Во-вторых, многие дефекты могут быть связаны с временнЫми параметрами, которые DTW попытается сгладить. |
Сообщ.
#9
,
|
|
|
Цитата antonsrv8 @ "Скажите, а будет ли возможным распознавание тех же дефектов с помощью MFCC + DTW? просто в одной их тем, тут на форему, данный "алгоритм" используется для подобного Распознавание отдельных слов. " Вряд ли Вы сможете ограничится использованием готовых методов. Основная работа - сбор базы данных дефектов речи и выявление специальных признаков, присущих им. Во-первых, людей с дефектами нужно набрать побольше (на мой взгляд, не меньше 10 на каждый дефект). Во-вторых, многие дефекты могут быть связаны с временнЫми параметрами, которые DTW попытается сгладить. Хм, спасибо учту, но над самой программой буду работать позже. где то с сентября или чуть раньше. сейчас мне эта информация больше на статью нужна и для проектирования программы |