
![]() |
Наши проекты:
Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту |
|
ПРАВИЛА | FAQ | Помощь | Поиск | Участники | Календарь | Избранное | RSS |
[18.97.14.81] |
![]() |
|
Сообщ.
#1
,
|
|
|
Приветствую всех) Решил воспользоваться помощью знатоков!! Мне нужно написать алгоритм, которые будет брать файл с разговором со слитной речью, а после поочередно заносить начало и конец каждого слова этого разговора в бд, знает ли кто нибудь, как реализовать такое алгоритм? возможно ли такое?
|
![]() |
Сообщ.
#2
,
|
|
Это называется "библиотека для распознавания речи". Прямо так можно и спросить у google.
|
Сообщ.
#3
,
|
|
|
Предлагаю следующий алгоритм:
1. Удаляем шумы 2. Отмечаем переходы через ноль в фонограмме 3. Копируем на вторую дорожку фонограмму со сдвигом чуть длиннее периода самой низкой фонемы 4. Фонограммы с отметками переходов через нуль объединяем в общий файл. 5 На прямой вход реверсивного счетчика подаем отметки сигнала перехода через нуль с первого канала на вычитающий со второго. В моменты когда нуль делим фонограмму так как появится не информативный участок , период который нам не интересен так как он ниже уровня частот нашей фонограммы. Примечание: Задержка должна быть больше чем время периода самой низкой частоты в звуке и короче времени при котором возникает эффект эха, не более 50 мс. Фазовый сдвиг звука до наступления эффекта звука человек не различает просто меняется окраска звука. |