Создал работающий вариант детектора речи, начал заниматься обработкой -> Форум на Исходниках.Ру

	Наши проекты: Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту

Здравствуйте, Гость ! [18.191.28.247]

Модераторы: RaD, nsh

Новое голосование

Создал работающий вариант детектора речи, начал заниматься обработкой

RaD	Сообщ. #1 , 10.02.01, 17:54
Unregistered	Создал работающий вариант детектора речи, начал заниматься обработкой

Denis	Сообщ. #2 , 12.06.01, 01:42
Unregistered	re: интересно какие признаки лежат в основе сего метода

ctranik	Сообщ. #3 , 02.05.04, 10:37
Member Профиль · PM Рейтинг (т): 1	Цитата RaD @ 10.02.01, 17:54 Создал работающий вариант детектора речи, начал заниматься обработкой здрасте было бы здорово если бы поделился исходником. и кстати уточни что обрабатываеш?

Boomerang	Сообщ. #4 , 08.05.04, 11:01
Unregistered	Если уж не хочешь выкладывать исходники (а они очень бы пригодились - курсовую по теме писать надо), то хотя бы скинь пару ссылок по теории - буду очень благодарен.

Paul	Сообщ. #5 , 17.05.04, 14:06
Newbie Профиль · PM Рейтинг (т): 0	Посмотрите на дату сообщения, и вы Поймёте...

RaD	Сообщ. #6 , 18.05.04, 09:36
Moderator Профиль · PM Поощрения: 24 Dgm Рейтинг (т): 23	Метод самый простой, основан на переходе через ноль. Если правильно помню, что там были слова Zero Crossing. Подходит для простых распознавателей команд Сайт ts.kmc.ru + Google.

Age

Сообщ. #7 , 05.08.04, 09:48

Junior

Профиль · PM

Рейтинг (т): 0

Цитата RaD @ 18.05.04, 12:36

Метод самый простой, основан на переходе через ноль.
Если правильно помню, что там были слова Zero Crossing.

Метод описан в :
1.Методы автоматического распознавания речи. Под ред. У.Ли. М.Мир, 1983
2.Цифровое представление речевых сигналов. Рабинер и Шафер. ТИИЭР №4, 1975, т.63

А алгоритм за речь помехи всевозможные не принимает ?
Например фоновый шум, образованный коктейль-эффектом (слышали наверное про такой) ?
И как насчет борьбы с искажениями оценки, обусловленных наличием линейного тренда ?

RaD

Сообщ. #8 , 05.08.04, 10:11

Moderator

Профиль · PM

Поощрения: 24 Dgm

Рейтинг (т): 23

Алгоритм древний, делается порог, начиная с которого хоть шум, хоть речь принимаются за полезный сигнал.
Сигнал накапливается в циклическом буфере.
Если он длится более секунды или около того, то передаём блоки из циклического буфера на дальнейшую обработку.
Если менее, то буфер сбрасывается ...

Хех, вот только не могу вспомнить, при чём тут Zero Crossing?

Age

Сообщ. #9 , 05.08.04, 10:14

Junior

Профиль · PM

Рейтинг (т): 0

Цитата RaD,5.08.04, 13:11

Хех, вот только не могу вспомнить, при чём тут Zero Crossing?

Превышение порога -- это детектор по энергии
А zero-crossing -- это для оценки гласный (<3kHz) / согласный (>3kHz) /тишина вокруг (вапче ничего)
жаль что путает речь и шум, хотелось бы более серьезный алгоритм .....

RaD	Сообщ. #10 , 06.08.04, 07:13
Moderator Профиль · PM Поощрения: 24 Dgm Рейтинг (т): 23	У меня есть задумка определять не речь/шум/тишина, а фонемы (среди которых будут виды шума и тишина). Это позволит упростить дальнейшую работу. Но дальше идеи это пока не сдвинулось.

Age

Сообщ. #11 , 06.08.04, 09:37

Junior

Профиль · PM

Рейтинг (т): 0

Цитата RaD,6.08.04, 10:13

У меня есть задумка определять не речь/шум/тишина, а фонемы (среди которых будут виды шума и тишина).

Это позволит упростить дальнейшую работу. Но дальше идеи это пока не сдвинулось.

Я тоже дошел до подобной идеи. :wall:

правда экспериментальные исследования показывают, что вариабельность фонем и различие в свойствах несущего сигнала не позволяют создать конечный фонетический алфавит, поэтому рекомендуют оценивать для начала ГИПЕРПРИЗНАКИ -- основные черты, типа сильно-фрикативный, гласный, назальный, ... а потом уже строить статистическую модель слогов и слов.
вводные слова про я нашел у:
Венцов. Касевич. Современные модели воспритяия речи: критический обзор. - 13.3 Модель анализа через синтез.
на сайте www.csa.ru (правда там с кодировкой фигня творится, придется поколдовать Штирлицем)

.. может на самом деле заняться выделением групп специфических признаков и фильтрацией по ним ...

Сообщение отредактировано: Age - 06.08.04, 09:55

RaD

Сообщ. #12 , 06.08.04, 10:15

Moderator

Профиль · PM

Поощрения: 24 Dgm

Рейтинг (т): 23

Цитата

вводные слова про я нашел у:
Венцов. Касевич. Современные модели воспритяия речи: критический обзор. - 13.3 Модель анализа через синтез.
на сайте www.csa.ru (правда там с кодировкой фигня творится, придется поколдовать Штирлицем)

Дай прямую ссылку.

Age	Сообщ. #13 , 06.08.04, 10:22
Junior Профиль · PM Рейтинг (т): 0	конкретно -- вот здесь (на содержание выйдешь самостоятельно) http://www.csa.ru/DistanceLearning/course4/ch21/ch21_3.html но я говорю, там какой то геморрой с кодировкой. у меня-то это в распечатке есть годичной давности.. успехов в раскодировании

1 пользователей читают эту тему (1 гостей и 0 скрытых пользователей)

0 пользователей:

[ Script execution time: 0,0285 ] [ 14 queries used ] [ Generated: 21.05.24, 07:31 GMT ]