На главную Наши проекты:
Журнал   ·   Discuz!ML   ·   Wiki   ·   DRKB   ·   Помощь проекту
ПРАВИЛА FAQ Помощь Участники Календарь Избранное RSS
msm.ru
Модераторы: RaD, nsh
  
> Распознавание изолированных "слов", фильтрация неизвестных
    Делаю по классике, MFCC (или RASTA-PLP как вариант) -> DTW. Словарь небольшой, 20-50 "слов", 5-6 темплейтов на слово. По минимальному расстоянию определяю "слово"). Распознавание дикторозависимое, понятное дело. Условия распознавания можно назвать незашумленными. Работает в целом неплохо.

    Есть только одна засада: как отсечь неизвестные "слова"? Допустим, на входе алгоритма диктор чихнул, ругнулся или в принципе произнес то, чего в словаре нет. Данное "слово" всегда будет иметь минимальное расстояние к какому-то темплейту из словаря, хотя его там нет. Можно ли это отделить? Такое вообще возможно?
      Ищите в интернете проблему OOV (Out Of Vocabulary words). Есть много решений для марковских моделей. Для DP не знаю - теперь этим только школьники занимаются в кружках по программированию
        Поищу. Спасибо.
        0 пользователей читают эту тему (0 гостей и 0 скрытых пользователей)
        0 пользователей:


        Рейтинг@Mail.ru
        [ Script execution time: 0,0206 ]   [ 15 queries used ]   [ Generated: 28.03.24, 19:13 GMT ]