Наши проекты:
Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту |
||
ПРАВИЛА | FAQ | Помощь | Поиск | Участники | Календарь | Избранное | RSS |
[34.231.180.210] |
|
Сообщ.
#1
,
|
|
|
НаучРук дал тему "Идентификация пользователя по голосу". Реализую на C#.
Идентификация будет проходить так. Человек (диктор) произносит в микрофон свое имя. В последующем он будет произносить имя и для идентификации. Сделано- Запись образца в wav. wav записывается с параметрами 22050 Гц, 1 канал(моно), 8 бит. С этого момента нужен ваш совет. Я представляю алгоритм так : 1. Из wav файла надо будет как то выделить само слово ("имя"). Т.е удалить тишину в начале и в конце файла. 2. Получить спектрограмму результата полученного в первом пункте (БПФ, ИМХО) 3. Удалить из спектра, частоты не входящие в частотный диапазон голоса 4. Собственно само сравнение Теперь вопросы 1. Правильно ли я составил алгоритм, если нет. подскажите как правильно 2. Если все таки правильно, то как действовать по 1 и 2 пунктам (для меня трудность именно первый пункт) 3. Само сравнение осуществлять с применением нейронных сетей или можно обойтись без них (если можно примеры не нейронных сетей) |
Сообщ.
#2
,
|
|
|
Цитата НаучРук дал тему "Идентификация пользователя по голосу". Реализую на C#. Целый год ничего не делал, диплом близко. Нужно сделать за майские праздники. Цитата Сделано- Запись образца в wav. wav записывается с параметрами 22050 Гц, 1 канал(моно), 8 бит. Нужно 16 бит Цитата 1. Правильно ли я составил алгоритм, если нет. подскажите как правильно Не совсем Цитата 2. Если все таки правильно, то как действовать по 1 и 2 пунктам (для меня трудность именно первый пункт) Удаление тишины обсуждается в теме на этой же странице VAD (Voice Activity Detection) Цитата 3. Само сравнение осуществлять с применением нейронных сетей или можно обойтись без них (если можно примеры не нейронных сетей) Две записи сравнивают с помощью алгоритма DTW, который на форуме уже много раз обсуждался. |
Сообщ.
#3
,
|
|
|
Я в такой штуке не силен, но иогу предположить. Ну я бы предположил, что сначала нужно составить спектрограмму. Потом в ней выделить именно то слово которое нужно. Т.е. у Вас будет слово, которое нужно найти, и звук. Спектрограммы слова и звука нужно будет сравнить, и до этого задать допустимое отклонение. Иначе слово в звуковом файле не найдется. Ну и после этого удалить ненужное начало и конец.
|
Сообщ.
#4
,
|
|
|
Цитата Целый год ничего не делал, диплом близко. Нужно сделать за майские праздники. Дык, кроме диплома есть еще производственная практика, после неё преддипломная с туевой хучей бумаг. затем госы и диплом... Играть в карманный бильярд не в моем стиле. Отдельно благодарен за направление по теме. Будут Вопросы задам. |
Сообщ.
#5
,
|
|
|
Добрый день. У меня такая же тема. Хотелось бы узнать, удалось ли выполнить поставленную задачу. Буду очень благодарен, если Вы поделитесь тем, что у Вас получилось.
|