Идентификация пользователя по голосу, нужен совет -> Форум на Исходниках.Ру

	Наши проекты: Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту

Здравствуйте, Гость ! [216.73.216.94]

Модераторы: RaD, nsh

Новое голосование

Идентификация пользователя по голосу, нужен совет

orengatling

Сообщ. #1 , 30.04.11, 12:55

Unregistered

НаучРук дал тему "Идентификация пользователя по голосу". Реализую на C#.

Идентификация будет проходить так. Человек (диктор) произносит в микрофон свое имя. В последующем он будет произносить имя и для идентификации.

Сделано- Запись образца в wav. wav записывается с параметрами 22050 Гц, 1 канал(моно), 8 бит.

С этого момента нужен ваш совет.

Я представляю алгоритм так :

1. Из wav файла надо будет как то выделить само слово ("имя"). Т.е удалить тишину в начале и в конце файла.
2. Получить спектрограмму результата полученного в первом пункте (БПФ, ИМХО)
3. Удалить из спектра, частоты не входящие в частотный диапазон голоса
4. Собственно само сравнение

Теперь вопросы

1. Правильно ли я составил алгоритм, если нет. подскажите как правильно
2. Если все таки правильно, то как действовать по 1 и 2 пунктам (для меня трудность именно первый пункт)
3. Само сравнение осуществлять с применением нейронных сетей или можно обойтись без них (если можно примеры не нейронных сетей)

nsh

Сообщ. #2 , 01.05.11, 10:58

Moderator

Профиль · PM

Цитата

НаучРук дал тему "Идентификация пользователя по голосу". Реализую на C#.

Целый год ничего не делал, диплом близко. Нужно сделать за майские праздники.

Цитата

Сделано- Запись образца в wav. wav записывается с параметрами 22050 Гц, 1 канал(моно), 8 бит.

Нужно 16 бит

Цитата

1. Правильно ли я составил алгоритм, если нет. подскажите как правильно

Не совсем

Цитата

2. Если все таки правильно, то как действовать по 1 и 2 пунктам (для меня трудность именно первый пункт)

Удаление тишины обсуждается в теме на этой же странице VAD (Voice Activity Detection)

Цитата

3. Само сравнение осуществлять с применением нейронных сетей или можно обойтись без них (если можно примеры не нейронных сетей)

Две записи сравнивают с помощью алгоритма DTW, который на форуме уже много раз обсуждался.

BezPoryadok

Сообщ. #3 , 01.05.11, 11:12

Unregistered

Я в такой штуке не силен, но иогу предположить. Ну я бы предположил, что сначала нужно составить спектрограмму. Потом в ней выделить именно то слово которое нужно. Т.е. у Вас будет слово, которое нужно найти, и звук. Спектрограммы слова и звука нужно будет сравнить, и до этого задать допустимое отклонение. Иначе слово в звуковом файле не найдется. Ну и после этого удалить ненужное начало и конец.

orengatling

Сообщ. #4 , 01.05.11, 14:47

Unregistered

Цитата

Целый год ничего не делал, диплом близко. Нужно сделать за майские праздники.

Дык, кроме диплома есть еще производственная практика, после неё преддипломная с туевой хучей бумаг. затем госы и диплом...
Играть в карманный бильярд не в моем стиле.
Отдельно благодарен за направление по теме. Будут Вопросы задам.

Dmit_try512	Сообщ. #5 , 20.12.14, 13:39
Newbie Профиль · PM Рейтинг (т): нет	Добрый день. У меня такая же тема. Хотелось бы узнать, удалось ли выполнить поставленную задачу. Буду очень благодарен, если Вы поделитесь тем, что у Вас получилось.

0 пользователей читают эту тему (0 гостей и 0 скрытых пользователей)

0 пользователей:

[ Script execution time: 0.0608 ] [ 15 queries used ] [ Generated: 2.07.26, 23:06 GMT ]