Определение начальной и конечной точки произнесенного слова в звуковом потоке
    
  ![]()  | 
Наши проекты:
 Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту  | 
|
| ПРАВИЛА | FAQ | Помощь | Поиск | Участники | Календарь | Избранное | RSS | 
| [216.73.216.5] | 
 
 | 
		
  | 
    Определение начальной и конечной точки произнесенного слова в звуковом потоке
    
  | 
         
         
         
          
           Сообщ.
           #1
          
          , 
          
         
         
        
       | 
    |
| 
         | 
      
          Приветствую всех) Решил воспользоваться помощью знатоков!! Мне нужно написать алгоритм, которые будет брать файл с разговором со слитной речью, а после поочередно заносить начало и конец каждого слова этого разговора в бд, знает ли кто нибудь, как реализовать такое алгоритм? возможно ли такое?   
        
       | 
    
| 
         
         
         
          
           Сообщ.
           #2
          
          , 
          
         
         
        
       | 
    |
| 
         | 
      
          Это называется "библиотека для распознавания речи". Прямо так можно и спросить у google.   
        
       | 
    
| 
         
         
         
          
           Сообщ.
           #3
          
          , 
          
         
         
        
       | 
    |
| 
         | 
      
          Предлагаю следующий алгоритм: 
        
      1. Удаляем шумы 2. Отмечаем переходы через ноль в фонограмме 3. Копируем на вторую дорожку фонограмму со сдвигом чуть длиннее периода самой низкой фонемы 4. Фонограммы с отметками переходов через нуль объединяем в общий файл. 5 На прямой вход реверсивного счетчика подаем отметки сигнала перехода через нуль с первого канала на вычитающий со второго. В моменты когда нуль делим фонограмму так как появится не информативный участок , период который нам не интересен так как он ниже уровня частот нашей фонограммы. Примечание: Задержка должна быть больше чем время периода самой низкой частоты в звуке и короче времени при котором возникает эффект эха, не более 50 мс. Фазовый сдвиг звука до наступления эффекта звука человек не различает просто меняется окраска звука.  |