Идентификация голоса -> Форум на Исходниках.Ру

	Наши проекты: Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту

Здравствуйте, Гость ! [3.142.156.255]

Модераторы: RaD, nsh

Новое голосование

Идентификация голоса

nyquist

Сообщ. #1 , 22.06.04, 20:18

Junior

Профиль · PM

Рейтинг (т): 3

Добрый день.

Вот разработал библиотечку для голосовой идентификации и верификции. На ее основе разработана система голосовой авторизации под семейство Windows NT. Т.е. реализизована надстройка над MSGINA. Общая функциональность авторизации не заменена, а только расширена.

Система вполне работоспособна. Однако очень интересует мнение аудитории о жизнестособности такой системы.

Уже существует тестовая, но полнофункциональная версия этой системы.

Если есть желание опробовать ее, пишите.

Буду также очень рад ответить на все вопросы и выслушать предложения.

Заране спасибо.

RaD	Сообщ. #2 , 23.06.04, 06:37
Moderator Профиль · PM Поощрения: 24 Dgm Рейтинг (т): 23	Интересна теория данного вопроса. Документацию сюда! Какие алгоритмы были использованы?

nyquist

Сообщ. #3 , 23.06.04, 16:37

Junior

Профиль · PM

Рейтинг (т): 3

>> Интересна теория данного вопроса. Документацию сюда! Какие алгоритмы были использованы?

Документацию, собственно. предоставить не могу. А вот что касается общих слов об использованных алгоритмах, то используется два критерия: частота основного тона (и ее, так сказать, распределение) и ряд коэффициентов, производных от лдинейного предсказания.

По сути, конечно, это не открытие Америки... Но все же. Это попытка создания реальной, практичеки применимой системы.

На данном этапе мне просто интересно мнение народа о подобного рода системе.

И, конечно, очень интересует качество ее работы в реальных условиях.

То, что могу предложить к опробыванию, - это полнофункциональная система авторизации под Win2000/XP/2003 с небольшими ограничениями.

А, если интересуют конкретные моменты реализации, то могу поделиться и этим (за некоторыми ограничениями)

RaD

Сообщ. #4 , 24.06.04, 06:44

Moderator

Профиль · PM

Поощрения: 24 Dgm

Рейтинг (т): 23

Проверим стандартные засады:
1. Ты пробовал её на разных компьютерах с разными звуковыми картами? Результаты?
2. Ты пробовал её с разными микрофонами на каждом из этих компьютеров? Результаты?
3. Микшер не забываешь настраивать?

Этих трёх вопросов тебе хватит надолго.

nyquist

Сообщ. #5 , 24.06.04, 08:35

Junior

Профиль · PM

Рейтинг (т): 3

>> Проверим стандартные засады:
>> 1. Ты пробовал её на разных компьютерах с разными звуковыми картами? Результаты?
>> 2. Ты пробовал её с разными микрофонами на каждом из этих компьютеров? Результаты?
>> 3. Микшер не забываешь настраивать?

>> Этих трёх вопросов тебе хватит надолго.

Что касается первого вопроса. Пробовал :rolleyes:

Об этом говорот только тот факт, что я состявлял тестовую базу дикторов именно на разных компьютерах (соответственно с разными карточким). Что же касается результата, то вот и предлагаю заценить результат моей работы именно самостотельно посмотрев работу программы.
Тут дело в том, что указание в числах достоверность идентификации и "отсеивания" дикторов мало кому может пригодиться (для масс), т.к. тут возникает ОЧЕНЬ много оговорок и нюансов, о которых многие производители просто напросто умалчивают (а без них то это "пустые" числа).

По второсу вопросу - тестировал только на электретных и динамических микрофонах. К угольным я и не хочу прикасаться. Что касается результатов, то комментарии сказаны в первом пункте.

Сразу хочу сказать. что это только первая попытка создания подобного рода систем. На данном этапе она вовсе не претендует на самую совершеную систему.

По третьему вопросу скажу так - в текущей версии программы микшер подстраивается пользователем ОДИН раз (в Виндах, к примеру, установки микшера глобальные и поэтому срабатываютт сразу для всех пользователей). Динамически подстраивается порог паузы. Далее идет предварительная обработка сигнала с отсеиванием пауз, излишне зашумленных участков, участков с перегрузкой (когда уровень сигнала выходит за рамки разрядной сетки). Выделеный в итоге сигнал нормализуется и т.д.

Поэтому АРУ микшерами здесь в лучшем случае не уместна.

Если интересны остальные моменты, то постараюсь прояснить и их.. B)

Добавлено в 24.06.04, 08:37:
Да вот, забыл отметить, что, естественно, под каждый микрофон и карточку симтему нужно переобучить.

Добавлено в 24.06.04, 08:45:
И еще. вот ссылочки на краткую инструкцию по эксплуатации
http://alex-nyquist.fromru.com/projects/ANVIS/readme.zip
:yes:

И

саму инсталляцию
http://alex-nyquist.fromru.com/projects/ANVIS/setup.exe
B)

RaD

Сообщ. #6 , 24.06.04, 09:11

Moderator

Профиль · PM

Поощрения: 24 Dgm

Рейтинг (т): 23

К сожалению, проверить систему в действии не смогу. Я давно уже не работаю с Windows.

Думаю, если создать иерархическую систему проверки, то можно достичь достаточно большой надёжности.
Смысл в следующем.

Допустим система применяется на предприятии, там есть отделы, у сотрудников есть должности.

Сначала система ожидает название отдела. Получив отдел, она переключает контекст на этот отдел и сохраняет параметры авторизующегося.

Затем человек называет свою должность. Получив должность, система получает финальный список поиска, одновременно анализируя параметры голоса.

Затем человек называет свою фамилию.

На основании этих данных, совместно с параметрами голоса, можно получить хорошую точность идентификации.

Основываясь только на данных о F0 и LPC многого не определишь.

P.S. Когда же я себя заставлю купить гарнитуру и продолжить работу по данной теме. Вроде на AltLinux уже есть всё, что надо для работы. Очень понравилась программа WaveSurfer. Очень хороший инструмент для анализа файлов с речью.

nyquist

Сообщ. #7 , 24.06.04, 09:33

Junior

Профиль · PM

Рейтинг (т): 3

>>

>> Основываясь только на данных о F0 и LPC многого не определишь

Ну, во-первых, я использую не чистые LPC

>> Думаю, если создать иерархическую систему проверки, то можно достичь достаточно большой надёжности.

Конечно, это возможность дальнейшего совершенствования системы и в этом нет особых проблем. Это, можно сказать, больше организационная сторода вопроса. Это, в любом случае, просто задача уменьшения количества тестируемые моделей дикторов (уменьшаем размерность задачи). В каком бы это варианте не было завуалировано.

Однако же я сразу спросил "Однако очень интересует мнение аудитории о жизнестособности такой системы", т.е. насколько удобно использование голосовой идентификации.

Ну, на сколько я понимаю, особо никого этот вопрос не заинтересовал (практическое использование) .

RaD

Сообщ. #8 , 24.06.04, 09:48

Moderator

Профиль · PM

Поощрения: 24 Dgm

Рейтинг (т): 23

Хожу по всяким организациям, многое видел.

Но идентификация по голосу - это пока фантастика (это версия).
Самое крутое с чем я сталкивался, это идентификация по ладони/отпечаткам пальцев.
При получении пропуска на объект, три раза суешь руку в "чёрный ящик", затем в "капсуле" проделываешь тоже самое, чтобы пройти дальше. Работает!
Безопасники не любят "фантастику", им нужна надёжность.

nyquist

Сообщ. #9 , 24.06.04, 10:31

Junior

Профиль · PM

Рейтинг (т): 3

>> Безопасники не любят "фантастику", им нужна надёжность.

Конечно, вся биометрия пока в большинстве случаев больше похожа на эту самую фантастику. Однако, ана очень удачно сочетается с "классическими" идентификациоными технологиями. Вот тут-то надежность именно повышается.

Например, как мне видится, подобная сстема в офисах могла бы быть полезна.

Вообщето тут очень много вопросов, большинство из которых фактически филосовские :rolleyes:

Добавлено в 24.06.04, 10:34:
Да, вот замечание из жизни...
Именно в офисах ОЧЕНЬ часто можно видеть работников, которые очень хорошо соблюдают мера безопасности :rolleyes:

, когда набирают свои пароли из записной книжки или запросто могут их передавать коллегам...

Какая уж тут безопасность :yes:

1 пользователей читают эту тему (1 гостей и 0 скрытых пользователей)

0 пользователей:

[ Script execution time: 0,0327 ] [ 14 queries used ] [ Generated: 17.05.24, 19:26 GMT ]