На главную
ПРАВИЛА FAQ Помощь Участники Календарь Избранное DigiMania RSS
msm.ru
Модераторы: RaD, nsh
  
> Определение языка голоса
Доброго времени суток, необходимо разработать модель способную отличить один язык от другого, их всего два. Модель просто должна говорить, что это язык A или же это язык B. Собственно сам вопрос: можно ли получать MFCC всего из всего аудио файла целиком, т.е. без разбиения на кадры, будут ли получившиеся коэффициенты характеризовать принадлежность к языку или же это будет каша, если каша то как лучше поступить?
Цитата
можно ли получать MFCC всего из всего аудио файла целиком, т.е. без разбиения на кадры, будут ли получившиеся


Это будет каша

Цитата
или же это будет каша, если каша то как лучше поступить?


Получить последовательность и натренировать нейросеть рекуррентную. Они обрабатывают последовательности и дают хорошие результаты.

http://www.isca-speech.org/archive/Intersp...6/pdfs/0686.PDF

для тренировки можно keras использовать.
http://nshmyrev.blogspot.com
Спасибо. Завтра займусь этим.
1 пользователей читают эту тему (1 гостей и 0 скрытых пользователей)
0 пользователей:


[ Script Execution time: 0,0629 ]   [ 19 queries used ]   [ Generated: 25.03.17, 23:42 GMT ]