Фонемное распознавание речи -> Форум на Исходниках.Ру

	Наши проекты: Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту

Здравствуйте, Гость ! [216.73.216.67]

Модераторы: RaD, nsh

Новое голосование

Фонемное распознавание речи

china_630	Сообщ. #166 , 04.03.08, 09:04
Unregistered	Всем привет. Нет ли случайно у кого-нибудь MFCC на Delphi? Да в принципе и на С пойдет :-)

goodass	Сообщ. #167 , 28.04.08, 18:16
Junior Профиль · PM Рейтинг (т): 1	china_630 HTK вам в помощь. Линуховый вариант предоставляется в виде СИшных библиотек. Правда насчет коммерческого использования читайте условия.

Gron	Сообщ. #168 , 16.05.08, 10:45
Unregistered	Кто знает, где достать программу пофонемной сегментации при помощи вейвлет-анализа? Подскажите, пожалуйста.

sergun83	Сообщ. #169 , 17.02.09, 18:09
Unregistered	Господа, подскажите, пожалуйста, методы (или ссылки на источники) для определения невокализованных участков. ЧОТ использовать не хочу.

Анатоль

Сообщ. #170 , 18.02.09, 13:38

Full Member

Профиль · PM

Поощрения: 2 Dgm

Рейтинг (т): 6

Цитата sergun83 @ 17.02.09, 18:09

методы для определения невокализованных участков. ЧОТ использовать не хочу.

Энергия вокализованных звуков речи лежит в основном в низкочастотной области.
Возьмите отношение (или разницу) энергии в низкочастотной полосе и высокочастотной.
Например 100-600гц. и 4000-5500гц.

sergun83

Сообщ. #171 , 18.02.09, 13:54

Unregistered

Цитата Анатоль @ 18.02.09, 13:38

Цитата sergun83 @ 17.02.09, 18:09

методы для определения невокализованных участков. ЧОТ использовать не хочу.

Спасибо за ответ, но энергия не подходит. Дело в том, что значения энергии для невокализованных звуков и значения энергии для тишины с шумом близки. А мне нужно отделить именно невокализованные звуки от тишины (шума).

Сообщение отредактировано: sergun83 - 18.02.09, 13:54

Анатоль

Сообщ. #172 , 18.02.09, 19:41

Full Member

Профиль · PM

Поощрения: 2 Dgm

Рейтинг (т): 6

Цитата sergun83 @ 18.02.09, 13:54

Дело в том, что значения энергии для невокализованных звуков и значения энергии для тишины с шумом близки.

Ну это не совсем так. Это справедливо для таких звуков, как "п" или "ф".
А энергия таких звуков как "ш" или "ч" очень большая. Да и других вполне заметна.
Но если шумы большие, то слабых шумных звуков Вы просто никак не обнаружите.
Ну разве что спект шумов Вам известен, или по динамике формант гласных можно определить прилегающие согласные.

shur_nn	Сообщ. #173 , 18.02.09, 20:05
Member Профиль · PM Поощрения: 1 Dgm Рейтинг (т): 1	Кстати интересная задачка - шум превышает по амплитуде в несколько раз звук "Ш". Чего делать будем ?

Анатоль	Сообщ. #174 , 19.02.09, 05:33
Full Member Профиль · PM Поощрения: 2 Dgm Рейтинг (т): 6	Цитата shur_nn @ 18.02.09, 20:05 Кстати интересная задачка - шум превышает по амплитуде в несколько раз звук "Ш". Чего делать будем ? Будем уши затыкать.

shur_nn	Сообщ. #175 , 19.02.09, 19:59
Member Профиль · PM Поощрения: 1 Dgm Рейтинг (т): 1	Я попробовал смешать "Ш" c белым шумом 1:10. Если слушать шум, а потом сумму, то "Ш" прекрасно слышно и распознаваемо.

Анатоль

Сообщ. #176 , 20.02.09, 05:35

Full Member

Профиль · PM

Поощрения: 2 Dgm

Рейтинг (т): 6

Цитата shur_nn @ 19.02.09, 19:59

Я попробовал смешать "Ш" c белым шумом 1:10. Если слушать шум, а потом сумму, то "Ш" прекрасно слышно и распознаваемо

Повторил Ваш эксперимент. Результат совсем противоположный.
Даже если смешать (добавить) к "ш" белый шум такой же амплитуды, то распознать там "ш" совершенно невозможно.
Тональные звуки можно услышать и распознать даже меньшей амплитуды, чем шум, а вот "ш" не получилось.
Может Вы реагировали на изменение амплитуды шума и воспринимали это как наличие там "ш"?

shur_nn

Сообщ. #177 , 20.02.09, 19:38

Member

Профиль · PM

Поощрения: 1 Dgm

Рейтинг (т): 1

Я думаю, что Вы производили измерения по абсолютной величине, а не относительной.
Я повторяю, сравните белый шум и белый шум+"Ш" в соотношении 10:1 (один за другим,
интервал между звуками не более 0.5 сек.). Я это делал.
Мое субъективное мнение, что относительно белого шума, звук "Ш" в белом шуме распознаваем
довольно отчетливо. Хочу заметить, что мы с Вами наверняка не одинаковы в плане восприятия звуков.
Я прослушивал звуки через наушники гарнитуры. Возможно Вы прослушивали
их через акустику в условиях зашумленного помешения, или уровень
звукового давление был недостаточный. Я провел довольно много времени за этим занятием.
Конечно я допускаю мысль, что моя слуховая система адаптировалась.
Я это слышу, значит распознавание шипящих на фоне белого шума возможно.
Правда не уверен, что оно возможно с использованием спектрального анализа.

shur_nn	Сообщ. #178 , 28.02.09, 21:59
Member Профиль · PM Поощрения: 1 Dgm Рейтинг (т): 1	Статью интересную по сегментации нашел. http://www.contrterror.tsure.ru/site/magazine12/07-16-Fedorov.htm

kaa1

Сообщ. #179 , 01.03.09, 03:37

Full Member

Профиль · PM

Поощрения: 1 Dgm

Рейтинг (т): 9

Цитата shur_nn @ 28.02.09, 21:59

Статью интересную по сегментации нашел.

Да, весёлая статья. В начале 91% точность сегментации. Потом ни одного упоминания этого числа нет. Зато точность в выводах значится уже 85%, а затем 75%. Исследования проводились на отдельных словах, а не на слитной речи. Алфавит - 36 фонем. Интересно каких? Ощущение, что не было мягких. Возможно, не было некоторых классов безударных. 10 дикторов - не указано количество мужчин и женщин и, конечно, не указана точность сегментации для каждого пола. Все рисунки разные - нет двух одинаковых сигналов, на одном из которых была бы ручная, а на другом автоматическая сегментация. Похоже, рисунки были приведены не для сравнения ручной и автоматической сегментации. Что означает "точность" при результате 85% непонятно. При 75% - понятно (расхождение менее 15 мс). В первом варианте считалось правильным, если граница определена до середины фонемы или вообще попала на фонему? Слишком много непонятностей, недосказанностей, поэтому не стал бы доверять и результату и алгоритму.

shur_nn

Сообщ. #180 , 01.03.09, 20:11

Member

Профиль · PM

Поощрения: 1 Dgm

Рейтинг (т): 1

По многим замечаниям с Вами соглашусь. Однако этот вариант довольно интересен.
Ошибка предсказания неоспоримый факт смены направления движения процесса.
Возможно эта статья просто краткая информация о проделанной работе?
Не знаю, но на мой взгляд в этой статье задано правильное направление.

0 пользователей читают эту тему (0 гостей и 0 скрытых пользователей)

0 пользователей:

Страницы: (15) « Первая ... 10 11 [12] 13 14 ... Последняя » все

[ Script execution time: 0,0408 ] [ 15 queries used ] [ Generated: 3.07.25, 16:10 GMT ]