Фонемное распознавание речи -> Форум на Исходниках.Ру

	Наши проекты: Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту

Здравствуйте, Гость ! [216.73.216.52]

Модераторы: RaD, nsh

Новое голосование

Фонемное распознавание речи

kaa1

Сообщ. #151 , 20.01.08, 10:13

Full Member

Профиль · PM

Поощрения: 1 Dgm

Рейтинг (т): 9

Цитата Hobbit @ 20.01.08, 00:33

имелись ввиду первые 4-5

Цитата Hobbit @ 20.01.08, 00:33

в каком диапазоне частот АЧХ имеет максимумы? Не в области ли ВЧ по отношения к первой строке?

Нет, не в этой области. Частота 4-5-й гармоники может совпадать с частотой второй форманты. А основной тон может находиться в той же частотной области, что и первая форманта, поэтому область формант не является более высокочастотной.

Цитата Hobbit @ 20.01.08, 00:33

Можно чуть подетальнее объяснить?

Если Вы употребляете понятие "область форманты", то значит Вы понимаете, что это такое, и у Вас не должно быть сложностей при вычислении средней частоты в этой области.

Сообщение отредактировано: kaa1 - 20.01.08, 10:15

Fleur	Сообщ. #152 , 11.02.08, 14:34
Unregistered	У кого-нибудь есть программа Raw Waveform? Прикреплённый файлРисунок2.jpg (84.69 Кбайт, скачиваний: 636)

nsh

Сообщ. #153 , 11.02.08, 20:29

Moderator

Профиль · PM

Ничего, что не в тему запостили

?

Это не программа называется Raw Waveform, это окошко называется так. А программа какая-то наша самописная судя по всему. Гораздо проще скачать Wavesurfer, там всё такое же есть:

http://www.speech.kth.se/wavesurfer/download.html

Fleur

Сообщ. #154 , 11.02.08, 21:19

Unregistered

Цитата nsh @ 11.02.08, 20:29

Ничего, что не в тему запостили

Просто эта программа позволяет выделить фонемы (судя по указанным в этом окошке вверху фонемам "Вы мне писали"), я и подумала, что сюда можно писать. :huh:

Есть у меня Wavesurfer, но как в ней получить разбиение слов на фонемы (как в том окошке вверху)?

nsh

Сообщ. #155 , 11.02.08, 21:39

Moderator

Профиль · PM

Это ручное выделение, если Вас это интересует. В Wavesurfer на панели щёлкаете правой кнопкой мыши - Add Pane->Transcription. Добавляется полоска с транскрипцией. На ней щёлкаете - Insert Label, двигаете метку, потом снова правой кнопой - Save All Labels. Сохраняете транскрипцию.

Добавлено 11.02.08, 21:41
P.S. Ни одна программа так точно границы пока искать не может

Добавлено 11.02.08, 22:01
Хотя нет, не так точно, на картинке после с перед а слишком рано граница

Fleur

Сообщ. #156 , 11.02.08, 22:10

Unregistered

Получается, что это мы сами пишем названия фонем. А я подумала, что программа сама выводит их, т.е. распознает.

Я изучаю вопрос распознавания речи по спектрограмме. Получила спектрограммы разных звуков, получается, что совершенно разные фонемы почти не отличаются друг от друга. Как тогда вообще распознавать?

nsh

Сообщ. #157 , 11.02.08, 22:31

Moderator

Профиль · PM

Ну как, про это целые книги написаны.

Вводную информацию можно посмотреть в энциклопедиях и поискать в сети, вроде

http://en.wikipedia.org/wiki/Speech_recognition

А более подробно нужно изучать по книге, вроде SLP:

http://festlang.berlios.de/docu/doku.php?id=speech_tech_faq&s=spoken

Добавлено 11.02.08, 22:39
А по спектрограмме специалист распознавать звуки может, конечно. Но для этого опыт нужен. Немного про это описано в
книжке Кривновой "Общая фонетика", например, из доступного в сети:

http://www.philol.msu.ru/~otipl/SpeechGroup/publications/krivnova-2001-2004/glava11.doc

ну и на английском литературы полно, например

http://home.cc.umanitoba.ca/~robh/howto.html

Вобщем, если вы проблему уточните, можно будет и литературу подходящую подыскать.

Fleur	Сообщ. #158 , 11.02.08, 22:42
Unregistered	nsh, спасибо за ссылки. Жаль, что все материалы на английском. Из второй ссылки книги Spoken Language Processing vol. 1 и 2 не открываются или это только у меня?

nsh

Сообщ. #159 , 11.02.08, 22:48

Moderator

Профиль · PM

Надо установить плагин для IE или просмотрщик djvu:

http://djvu.sourceforge.net/

Добавлено 11.02.08, 22:54
Ну и вот это ещё стоит про спектрограммы поглядеть:

http://cslu.cse.ogi.edu/tutordemos/SpectrogramReading/spectrogram_reading.html
http://www.chass.utoronto.ca/~danhall/lin228/acoustics.html
http://arse.sourceforge.net/examples.shtml

И, если удастся:

Ladefoged, Peter: A Course In Phonetics: Third Edition, page 60. Harcourt Brace College Publishers, 1993

Fleur

Сообщ. #160 , 11.02.08, 22:56

Unregistered

Спасибо за ссылки!

Проблема заключается в распознавании речи именно по спектрограмме.

За Кривнову спасибо.
Есть ли у кого-нибудь работы Зиновьевой Н.В? Например, Зиновьева Н.В. Система акустических ключей к распознаванию фонетических единиц русского языка?

iitta

Сообщ. #161 , 12.02.08, 11:32

Member

Профиль · PM

Рейтинг (т): 4

Лет десять назад я писал обзор по автоматическому распознаванию речи для одной фирмы, кусок из которого привожу:

...Считается, что для идентификации гласной достаточно двух первых формант, поэтому гласные часто изображают на плоскости F1,F2, где они образуют вытянутый треугольник. Возможно, третья форманта является дополнительным, избыточным признаком гласной. Некоторым подтверждением этой точки зрения является факт, что человек может научиться читать "видимую речь" (спектр в координатах ВРЕМЯ-ЧАСТОТА, где максимумы амплитуды спектра отображаются почернением или пиками для трехмерных изображений). Заранее отметим, что это умение никак не отразилось на создании систем автоматического распознавания речи. Либо виртуозы чтения не могут вербализовать правила, которыми они пользуются при чтении, то есть используются столь же мало познанные процессы зрительного восприятия, либо ошибки распознавания по видимой речи больше, чем в системах автоматического распознавания (уровень ошибок распознавания по видимой речи, насколько мне известно, никто не измерял)...

Может быть, кто-нибудь сделает upgrade высказанных соображений?

nsh

Сообщ. #162 , 12.02.08, 15:57

Moderator

Профиль · PM

Ну да, прикольно было бы научиться, вот тут:

http://home.cc.umanitoba.ca/~robh/

даже соревнования проводятся - каждый месяц вывешивают спектрограмму и по ней надо понять, что за звук. Я вот думаю - не заняться ли читерством - написать прогу которая по спектрограмме звук делает

Добавлено 12.02.08, 16:00
iitta: кстати, там есть архив спектрограм, там везде объяснено, почему какая-то фонема выделена. Хотя это объяснения на объяснения Шерлока Холмса похожи, слишком вытянуты.

http://home.cc.umanitoba.ca/~robh/archive.html

iitta	Сообщ. #163 , 13.02.08, 08:59
Member Профиль · PM Рейтинг (т): 4	nsh: спасибо. Как я понял, это интернациональная забава специалистов в области речи.

Fleur	Сообщ. #164 , 03.03.08, 16:26
Unregistered	Нет ли случайно программы построения спектрограмм на Delphi?

nsh	Сообщ. #165 , 03.03.08, 17:48
Moderator Профиль · PM	Есть, но бяку лучше бросить http://majority.wsnw.net/fft.zip

1 пользователей читают эту тему (1 гостей и 0 скрытых пользователей)

0 пользователей:

Страницы: (15) « Первая ... 9 10 [11] 12 13 ... Последняя » все

[ Script execution time: 0,1403 ] [ 14 queries used ] [ Generated: 5.07.25, 09:52 GMT ]