Наши проекты:
Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту |
||
ПРАВИЛА | FAQ | Помощь | Поиск | Участники | Календарь | Избранное | RSS |
[3.149.234.141] |
|
Сообщ.
#1
,
|
|
|
HI
Есть задача распознавания речевых команд: небольшое число команд (2-10), предварительно известных. Требуется минимум возможного обучения на конкретного диктора. Какие алгоритмы (выделение слова, распознавание и т.д.) можно использовать? Евгений |
Сообщ.
#2
,
|
|
|
Загляни на титульную страничку раздела "Речевые технологии"
Если кратко, то: 1. Программа проводит непрерывное прослушивание. 2. С помощью амплитудного метода происходит выделение слов из общего потока. 3. Полученный блок данных подвергается нормализации. 4. Блок данных разбивается на кадры перекрывающим методом. 5. Каждый кадр переводится в набор коэффициентов с помощью преобразования Фурье. 6. Полученный вектор коэффициентов (для всего блока данных) сравнивается со всеми шаблонами с помощью метода Dynamic Time Warping. 7. Пользователю выдается результат. Советую повнимательнее посмотреть мой диплом. В его конце дана куча ссылок! |
Сообщ.
#3
,
|
|
|
Хорошо ли распознает
Я уже делал подобный алгоритм, но для распознавания использовал однослойный перцептрон. Так вот, перцептрон практически был не защищен от шума. Как с этим обстоит в DTW? |
Сообщ.
#4
,
|
|
|
Честно говоря...
Цитата: _<<_В результате на защиту диплома было создано приложение, которое достаточно уверенно распознавало до 10 команд пользователя._>>_ Если количество шаблонов не превышает 10 и созданы тихие условия (обычные комнатные), то программа достаточно точно работает. DTW алгоритм выдает оценку, я подогнал границы и программа работала... но это очень древний алгоритм Мне интересно посмотреть на реализацию распознавания команд с применением однослойного перцептрона. |
Сообщ.
#5
,
|
|
|
Перцептрон
Попробуй обучить перцептрон (послан на мыло) |