На главную Наши проекты:
Журнал   ·   Discuz!ML   ·   Wiki   ·   DRKB   ·   Помощь проекту
ПРАВИЛА FAQ Помощь Участники Календарь Избранное RSS
msm.ru
Модераторы: RaD, nsh
Страницы: (2) 1 [2]  все  ( Перейти к последнему сообщению )  
> Оценка качества MFCC
    Спасибо Николай!
    Математикам при жизни надо ставить памятник =) Даже после такого подробного объяснения я до конца не прозрел.
      Получилось немного получше

      восстановление фазы оригинального звука
      user posted image
      полученый wav файл


      восстановление фазы синтезированного звука
      user posted image
      полученый wav файл

      Я так понимаю основная загвоздка всё таки в основном тоне...
        Если я всё правильно понимаю, то результат у меня получился не хуже

        в примерах http://web.mit.edu/jvb/www/signalrec/
        частота дискретизации: 14700Гц
        длина окна: 200 значений (либо 100? - 100 sample STFT window size, 200 FFT bins per window)
        шаг окна в примерах судя повсему обозначен как Hop Size

        у меня:
        частота дискретизации: 8000Гц
        длина окна - 256 значений
        восстановление при шаге в 10 значений - файл
        восстановление при шаге в 30 значений - файл
        восстановление при шаге в 50 значений - файл
        восстановление при шаге в 70 значений - файл
        восстановление при шаге в 80 значений - файл

        Добавлено
        В дополнении синтезированный звук файл
        Сообщение отредактировано: zamir -
        0 пользователей читают эту тему (0 гостей и 0 скрытых пользователей)
        0 пользователей:


        Рейтинг@Mail.ru
        [ Script execution time: 0,0215 ]   [ 15 queries used ]   [ Generated: 7.10.24, 08:11 GMT ]