Наши проекты:
Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту |
||
ПРАВИЛА | FAQ | Помощь | Поиск | Участники | Календарь | Избранное | RSS |
[18.97.9.174] |
|
Сообщ.
#1
,
|
|
|
Здравствуйте. Для дипломной работы появилась идея написать прогу, которая бы определяла человека по голосу. Прочитал, что используют MFCC.
Написал на Python запись голоса с микро, затем нашел алгоритм как получать MFCC. В итоге у меня получился массив из 30 кепстр. коэф. на каждые 0.025 секунд (примерно 30 на 200). И тут вопрос. А что с ними делать дальше? Просуммировать коэф. на всей временной оси, получить средние и сравнивать уже по ним, или по всему массиву? И можно как-нибудь сюда засунуть нейронные сети. Помогите пжл дэбилу (мне) |