Распознавание гласных звуков -> Форум на Исходниках.Ру

	Наши проекты: Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту

Здравствуйте, Гость ! [216.73.216.113]

Модераторы: RaD, nsh

Новое голосование

Распознавание гласных звуков

Haze	Сообщ. #16 , 03.08.13, 10:44
Member Профиль · PM Поощрения: 1 Dgm Рейтинг (т): 3	Цитата immort001 @ 30.07.13, 20:31 Цитата (Haze @ 30 июля, 22:55) А что, если не по осциллограмме сигнала это делать, а по спектрам периодов сигнала? Делайте на основе MFCC и не изобретайте велосипед. Все делали -- у всех работает.

immort001	Сообщ. #17 , 07.08.13, 13:10
Newbie Профиль · PM Рейтинг (т): нет	Цитата nsh @ 01.08.13, 15:49 Цитата а какой самый лучший способ? Лучшее враг хорошего. Хорошо, а какие тогда ещё можно использовать способы?

webcoder88

Сообщ. #18 , 21.11.15, 10:40

Junior

Профиль · PM

Рейтинг (т): нет

Мел-кепстральные коэффициенты привязаны к конкретному голосу диктора. Этот метод лучше использовать в системах идентификации человека по голосу.
В свое время я программно резал гласные на периоды и сравнивал на графике (нужна расяжка, тк период понемногу изменяется в соответствии с интонацией) и даже пытался вычитать периоды друг из друга. Для выделения границ фонем использовал временной сдвиг на 1 период и вычитание сигналов по всему файлов. В теории должно что-то получится, а на практике ничего не получилось. Если из значений звукового файла вычесть те же значения его копии, то получается 0, те сдвигаешь на 1 период и получаются всплески на границах и прямая линия на остальном участке.

Лучше не пробовать.

Сообщение отредактировано: webcoder88 - 21.11.15, 10:49

zamir

Сообщ. #19 , 21.11.15, 12:18

Full Member

Профиль · PM

Поощрения: 1 Dgm

Рейтинг (т): 9

Цитата

Мел-кепстральные коэффициенты привязаны к конкретному голосу диктора.

Это не сильно мешает распознаванию гласных звуков. Усреднённые модели дают не плохой результат. Если в процессе распознавания адаптироваться к речевому тракту диктора, то результат распозвания гласных станет даже очень хорошим. В интернет есть результаты экспереминтов распознавания гласных при помощи формант при усреднении по всем дикторам и усреднении по распознаваемому диктору - результаты вполне причные, и это при том что признаков гораздо меньше чем в mfcc.

Сообщение отредактировано: zamir - 21.11.15, 22:14

0 пользователей читают эту тему (0 гостей и 0 скрытых пользователей)

0 пользователей:

Страницы: (2) 1 [2] все

[ Script execution time: 0,0764 ] [ 15 queries used ] [ Generated: 17.12.25, 17:24 GMT ]