На главную Наши проекты:
Журнал   ·   Discuz!ML   ·   Wiki   ·   DRKB   ·   Помощь проекту
ПРАВИЛА FAQ Помощь Участники Календарь Избранное RSS
msm.ru
Модераторы: RaD, nsh
  
> Автоматизация определения(распознавания) дефектов в произношении
    Здравствуйте.
    Прошу подсказки, совета или помощи.
    Задача такая: Дипломная работа на тему распознавание дефектов в произношении.
    Описание: нередко кто в детстве сталкивался с логопедом. Его задача определить все дефекты в речи и назначить упражнения по ее коррекции.
    Задача состоит в автоматизации распознавания этих дефектов путем сравнения эталонного произношения с произнесенным через микрофон и сообщение какие дефекты есть.
    Проблема с алгоритмами или методами сравнения эталонного и произнесенного.
    Нужно разбить звуковой файл на фонемы, сравнить их количество(есть такой дефект пропускания букв)
    проверить похожи ли те звуки(который в данный момент проверяется)на созвучные, например б-п, д-т и т.д. (дефект замены одного звука другим)
    и в конце проверить насколько звук искажен(или просто определить процент искажения звука и если он искажен предположим на более чем 10% считать это дефектом).

    Подскажите, какие методы или алгоритмы можно(лучше) использовать для этого?
      Поздновато начинать дипломную работу. Тем более без руководителя. Литературу по определению недостатков речи можно найти в google по ключевым словам "disfluency detection" это обширная тема. Например можно начать с http://research.microsoft.com/apps/pubs/de....aspx?id=193166

      В короткий срок по disfluency detection можно сделать только определение несложных замен звуков как с и ш. Сделать это можно с помощью моделей CMUSphinx, просто написать грамматику вариантов и составить словарь.
      Сообщение отредактировано: nsh -
        Цитата nsh @

        это не в короткий срок)) это еще полтора года)

        Добавлено
        А на счет ключевых слов, спасибо. я пыталась найти по другим словам. и у меня выходило всего пара статей.
          И все-таки это не про то. имею ввиду "disfluency detection". по нему нашла только статьи со словами паразитами типа: ммм, эм, гм.. тд. но вон ту модель можно попробовать применить
            Цитата
            это не в короткий срок)) это еще полтора года)


            А, ну здорово, тогда можно развернуться.

            Цитата
            по нему нашла только статьи со словами паразитами типа: ммм, эм, гм.. тд. но вон ту модель можно попробовать применить


            Ссылок можно много найти. Держите в курсе успехов.
              Цитата nsh @
              Цитата
              это не в короткий срок)) это еще полтора года)


              А, ну здорово, тогда можно развернуться.

              Цитата
              по нему нашла только статьи со словами паразитами типа: ммм, эм, гм.. тд. но вон ту модель можно попробовать применить


              Ссылок можно много найти. Держите в курсе успехов.

              Скажите, а будет ли возможным распознавание тех же дефектов с помощью MFCC + DTW? просто в одной их тем, тут на форему, данный "алгоритм" используется для подобного Распознавание отдельных слов.

              Добавлено
              и еще вопрос. Есть ли какие нибудь алгоритмы или вообще где-нибудь записано как вообще составлять свою грамматику и словарь для CMUSphinx?
                Цитата
                Скажите, а будет ли возможным распознавание тех же дефектов с помощью MFCC + DTW? просто в одной их тем, тут на форему, данный "алгоритм" используется для подобного Распознавание отдельных слов.


                Да, возможно.

                Цитата
                и еще вопрос. Есть ли какие нибудь алгоритмы или вообще где-нибудь записано как вообще составлять свою грамматику и словарь для CMUSphinx?


                Описание грамматики для CMUSphinx можно найти тут:

                http://www.w3.org/TR/2000/NOTE-jsgf-20000605/

                Документацию по работе с CMUSphinx можно найти тут:

                http://cmusphinx.sourceforge.net/wiki/tutorial
                  "Скажите, а будет ли возможным распознавание тех же дефектов с помощью MFCC + DTW? просто в одной их тем, тут на форему, данный "алгоритм" используется для подобного Распознавание отдельных слов. "

                  Вряд ли Вы сможете ограничится использованием готовых методов. Основная работа - сбор базы данных дефектов речи и выявление специальных признаков, присущих им. Во-первых, людей с дефектами нужно набрать побольше (на мой взгляд, не меньше 10 на каждый дефект). Во-вторых, многие дефекты могут быть связаны с временнЫми параметрами, которые DTW попытается сгладить.
                    Цитата antonsrv8 @
                    "Скажите, а будет ли возможным распознавание тех же дефектов с помощью MFCC + DTW? просто в одной их тем, тут на форему, данный "алгоритм" используется для подобного Распознавание отдельных слов. "

                    Вряд ли Вы сможете ограничится использованием готовых методов. Основная работа - сбор базы данных дефектов речи и выявление специальных признаков, присущих им. Во-первых, людей с дефектами нужно набрать побольше (на мой взгляд, не меньше 10 на каждый дефект). Во-вторых, многие дефекты могут быть связаны с временнЫми параметрами, которые DTW попытается сгладить.

                    Хм, спасибо учту, но над самой программой буду работать позже. где то с сентября или чуть раньше. сейчас мне эта информация больше на статью нужна и для проектирования программы
                    1 пользователей читают эту тему (1 гостей и 0 скрытых пользователей)
                    0 пользователей:


                    Рейтинг@Mail.ru
                    [ Script execution time: 0,0275 ]   [ 14 queries used ]   [ Generated: 20.05.24, 10:16 GMT ]