На главную Наши проекты:
Журнал   ·   Discuz!ML   ·   Wiki   ·   DRKB   ·   Помощь проекту
ПРАВИЛА FAQ Помощь Участники Календарь Избранное RSS
msm.ru
Модераторы: RaD, nsh
  
> Идентификация пользователя по голосу, нужен совет
    НаучРук дал тему "Идентификация пользователя по голосу". Реализую на C#.

    Идентификация будет проходить так. Человек (диктор) произносит в микрофон свое имя. В последующем он будет произносить имя и для идентификации.

    Сделано- Запись образца в wav. wav записывается с параметрами 22050 Гц, 1 канал(моно), 8 бит.

    С этого момента нужен ваш совет.

    Я представляю алгоритм так :

    1. Из wav файла надо будет как то выделить само слово ("имя"). Т.е удалить тишину в начале и в конце файла.
    2. Получить спектрограмму результата полученного в первом пункте (БПФ, ИМХО)
    3. Удалить из спектра, частоты не входящие в частотный диапазон голоса
    4. Собственно само сравнение

    Теперь вопросы :)

    1. Правильно ли я составил алгоритм, если нет. подскажите как правильно
    2. Если все таки правильно, то как действовать по 1 и 2 пунктам (для меня трудность именно первый пункт)
    3. Само сравнение осуществлять с применением нейронных сетей или можно обойтись без них (если можно примеры не нейронных сетей)
      Цитата
      НаучРук дал тему "Идентификация пользователя по голосу". Реализую на C#.


      Целый год ничего не делал, диплом близко. Нужно сделать за майские праздники.

      Цитата
      Сделано- Запись образца в wav. wav записывается с параметрами 22050 Гц, 1 канал(моно), 8 бит.


      Нужно 16 бит

      Цитата
      1. Правильно ли я составил алгоритм, если нет. подскажите как правильно


      Не совсем

      Цитата
      2. Если все таки правильно, то как действовать по 1 и 2 пунктам (для меня трудность именно первый пункт)


      Удаление тишины обсуждается в теме на этой же странице VAD (Voice Activity Detection)

      Цитата
      3. Само сравнение осуществлять с применением нейронных сетей или можно обойтись без них (если можно примеры не нейронных сетей)


      Две записи сравнивают с помощью алгоритма DTW, который на форуме уже много раз обсуждался.
        Я в такой штуке не силен, но иогу предположить. Ну я бы предположил, что сначала нужно составить спектрограмму. Потом в ней выделить именно то слово которое нужно. Т.е. у Вас будет слово, которое нужно найти, и звук. Спектрограммы слова и звука нужно будет сравнить, и до этого задать допустимое отклонение. Иначе слово в звуковом файле не найдется. Ну и после этого удалить ненужное начало и конец.
          Цитата
          Целый год ничего не делал, диплом близко. Нужно сделать за майские праздники.

          Дык, кроме диплома есть еще производственная практика, после неё преддипломная с туевой хучей бумаг. затем госы и диплом...
          Играть в карманный бильярд не в моем стиле.
          Отдельно благодарен за направление по теме. Будут Вопросы задам.
            Добрый день. У меня такая же тема. Хотелось бы узнать, удалось ли выполнить поставленную задачу. Буду очень благодарен, если Вы поделитесь тем, что у Вас получилось.
            0 пользователей читают эту тему (0 гостей и 0 скрытых пользователей)
            0 пользователей:


            Рейтинг@Mail.ru
            [ Script execution time: 0,0415 ]   [ 15 queries used ]   [ Generated: 1.05.24, 06:26 GMT ]