
![]() |
Наши проекты:
Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту |
|
ПРАВИЛА | FAQ | Помощь | Поиск | Участники | Календарь | Избранное | RSS |
[3.137.173.170] |
![]() |
|
Сообщ.
#1
,
|
|
|
Делаю по классике, MFCC (или RASTA-PLP как вариант) -> DTW. Словарь небольшой, 20-50 "слов", 5-6 темплейтов на слово. По минимальному расстоянию определяю "слово"). Распознавание дикторозависимое, понятное дело. Условия распознавания можно назвать незашумленными. Работает в целом неплохо.
Есть только одна засада: как отсечь неизвестные "слова"? Допустим, на входе алгоритма диктор чихнул, ругнулся или в принципе произнес то, чего в словаре нет. Данное "слово" всегда будет иметь минимальное расстояние к какому-то темплейту из словаря, хотя его там нет. Можно ли это отделить? Такое вообще возможно? |
Сообщ.
#2
,
|
|
|
Ищите в интернете проблему OOV (Out Of Vocabulary words). Есть много решений для марковских моделей. Для DP не знаю - теперь этим только школьники занимаются в кружках по программированию
|
Сообщ.
#3
,
|
|
|
Поищу. Спасибо.
|