На главную Наши проекты:
Журнал   ·   Discuz!ML   ·   Wiki   ·   DRKB   ·   Помощь проекту
ПРАВИЛА FAQ Помощь Участники Календарь Избранное RSS
msm.ru
Модераторы: RaD, nsh
  
> Определение начальной и конечной точки произнесенного слова в звуковом потоке
    Приветствую всех) Решил воспользоваться помощью знатоков!! Мне нужно написать алгоритм, которые будет брать файл с разговором со слитной речью, а после поочередно заносить начало и конец каждого слова этого разговора в бд, знает ли кто нибудь, как реализовать такое алгоритм? возможно ли такое?
      Это называется "библиотека для распознавания речи". Прямо так можно и спросить у google.
        Предлагаю следующий алгоритм:
        1. Удаляем шумы
        2. Отмечаем переходы через ноль в фонограмме
        3. Копируем на вторую дорожку фонограмму со сдвигом чуть длиннее периода самой низкой фонемы
        4. Фонограммы с отметками переходов через нуль объединяем в общий файл.
        5 На прямой вход реверсивного счетчика подаем отметки сигнала перехода через нуль с первого канала на вычитающий со второго. В моменты когда нуль делим фонограмму так как появится не информативный участок , период который нам не интересен так как он ниже уровня частот нашей фонограммы.
        Примечание:
        Задержка должна быть больше чем время периода самой низкой частоты в звуке и короче времени при котором возникает эффект эха, не более 50 мс.
        Фазовый сдвиг звука до наступления эффекта звука человек не различает просто меняется окраска звука.
        0 пользователей читают эту тему (0 гостей и 0 скрытых пользователей)
        0 пользователей:


        Рейтинг@Mail.ru
        [ Script execution time: 0,0267 ]   [ 16 queries used ]   [ Generated: 28.03.24, 20:20 GMT ]