Определение начальной и конечной точки произнесенного слова в звуковом потоке -> Форум на Исходниках.Ру

	Наши проекты: Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту

Здравствуйте, Гость ! [216.73.216.156]

Модераторы: RaD, nsh

Новое голосование

Определение начальной и конечной точки произнесенного слова в звуковом потоке

yusupov

Сообщ. #1 , 03.02.16, 17:59

Newbie

Профиль · PM

Рейтинг (т): нет

Приветствую всех) Решил воспользоваться помощью знатоков!! Мне нужно написать алгоритм, которые будет брать файл с разговором со слитной речью, а после поочередно заносить начало и конец каждого слова этого разговора в бд, знает ли кто нибудь, как реализовать такое алгоритм? возможно ли такое?

nsh	Сообщ. #2 , 05.02.16, 10:01
Moderator Профиль · PM	Это называется "библиотека для распознавания речи". Прямо так можно и спросить у google.

babai-rais

Сообщ. #3 , 03.11.20, 08:48

Newbie

Профиль · PM

Рейтинг (т): нет

Предлагаю следующий алгоритм:
1. Удаляем шумы
2. Отмечаем переходы через ноль в фонограмме
3. Копируем на вторую дорожку фонограмму со сдвигом чуть длиннее периода самой низкой фонемы
4. Фонограммы с отметками переходов через нуль объединяем в общий файл.
5 На прямой вход реверсивного счетчика подаем отметки сигнала перехода через нуль с первого канала на вычитающий со второго. В моменты когда нуль делим фонограмму так как появится не информативный участок , период который нам не интересен так как он ниже уровня частот нашей фонограммы.
Примечание:
Задержка должна быть больше чем время периода самой низкой частоты в звуке и короче времени при котором возникает эффект эха, не более 50 мс.
Фазовый сдвиг звука до наступления эффекта звука человек не различает просто меняется окраска звука.

1 пользователей читают эту тему (1 гостей и 0 скрытых пользователей)

0 пользователей:

[ Script execution time: 0.0627 ] [ 14 queries used ] [ Generated: 2.08.26, 02:00 GMT ]