Наши проекты:
Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту |
||
ПРАВИЛА | FAQ | Помощь | Поиск | Участники | Календарь | Избранное | RSS |
[18.191.28.247] |
|
Сообщ.
#1
,
|
|
|
Создал работающий вариант детектора речи, начал заниматься обработкой
|
Сообщ.
#2
,
|
|
|
re: интересно какие признаки лежат в основе сего метода
|
Сообщ.
#3
,
|
|
|
Цитата RaD @ 10.02.01, 17:54 Создал работающий вариант детектора речи, начал заниматься обработкой здрасте было бы здорово если бы поделился исходником. и кстати уточни что обрабатываеш? |
Сообщ.
#4
,
|
|
|
Если уж не хочешь выкладывать исходники (а они очень бы пригодились - курсовую по теме писать надо), то хотя бы скинь пару ссылок по теории - буду очень благодарен.
|
Сообщ.
#5
,
|
|
|
Посмотрите на дату сообщения, и вы Поймёте...
|
Сообщ.
#6
,
|
|
|
Метод самый простой, основан на переходе через ноль.
Если правильно помню, что там были слова Zero Crossing. Подходит для простых распознавателей команд Сайт ts.kmc.ru + Google. |
Сообщ.
#7
,
|
|
|
Цитата RaD @ 18.05.04, 12:36 Метод самый простой, основан на переходе через ноль. Если правильно помню, что там были слова Zero Crossing. Метод описан в : 1.Методы автоматического распознавания речи. Под ред. У.Ли. М.Мир, 1983 2.Цифровое представление речевых сигналов. Рабинер и Шафер. ТИИЭР №4, 1975, т.63 А алгоритм за речь помехи всевозможные не принимает ? Например фоновый шум, образованный коктейль-эффектом (слышали наверное про такой) ? И как насчет борьбы с искажениями оценки, обусловленных наличием линейного тренда ? |
Сообщ.
#8
,
|
|
|
Алгоритм древний, делается порог, начиная с которого хоть шум, хоть речь принимаются за полезный сигнал.
Сигнал накапливается в циклическом буфере. Если он длится более секунды или около того, то передаём блоки из циклического буфера на дальнейшую обработку. Если менее, то буфер сбрасывается ... Хех, вот только не могу вспомнить, при чём тут Zero Crossing? |
Сообщ.
#9
,
|
|
|
Цитата RaD,5.08.04, 13:11 Хех, вот только не могу вспомнить, при чём тут Zero Crossing? Превышение порога -- это детектор по энергии А zero-crossing -- это для оценки гласный (<3kHz) / согласный (>3kHz) /тишина вокруг (вапче ничего) жаль что путает речь и шум, хотелось бы более серьезный алгоритм ..... |
Сообщ.
#10
,
|
|
|
У меня есть задумка определять не речь/шум/тишина, а фонемы (среди которых будут виды шума и тишина).
Это позволит упростить дальнейшую работу. Но дальше идеи это пока не сдвинулось. |
Сообщ.
#11
,
|
|
|
Цитата RaD,6.08.04, 10:13 У меня есть задумка определять не речь/шум/тишина, а фонемы (среди которых будут виды шума и тишина). Это позволит упростить дальнейшую работу. Но дальше идеи это пока не сдвинулось. Я тоже дошел до подобной идеи. правда экспериментальные исследования показывают, что вариабельность фонем и различие в свойствах несущего сигнала не позволяют создать конечный фонетический алфавит, поэтому рекомендуют оценивать для начала ГИПЕРПРИЗНАКИ -- основные черты, типа сильно-фрикативный, гласный, назальный, ... а потом уже строить статистическую модель слогов и слов. вводные слова про я нашел у: Венцов. Касевич. Современные модели воспритяия речи: критический обзор. - 13.3 Модель анализа через синтез. на сайте www.csa.ru (правда там с кодировкой фигня творится, придется поколдовать Штирлицем) .. может на самом деле заняться выделением групп специфических признаков и фильтрацией по ним ... |
Сообщ.
#12
,
|
|
|
Цитата вводные слова про я нашел у: Венцов. Касевич. Современные модели воспритяия речи: критический обзор. - 13.3 Модель анализа через синтез. на сайте www.csa.ru (правда там с кодировкой фигня творится, придется поколдовать Штирлицем) Дай прямую ссылку. |
Сообщ.
#13
,
|
|
|
конкретно -- вот здесь (на содержание выйдешь самостоятельно)
http://www.csa.ru/DistanceLearning/course4/ch21/ch21_3.html но я говорю, там какой то геморрой с кодировкой. у меня-то это в распечатке есть годичной давности.. успехов в раскодировании |