Наши проекты:
Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту |
||
ПРАВИЛА | FAQ | Помощь | Поиск | Участники | Календарь | Избранное | RSS |
[34.231.180.210] |
|
Страницы: (2) [1] 2 все ( Перейти к последнему сообщению ) |
Сообщ.
#1
,
|
|
|
Вот потихоньку пишу свою библиотечку. Появилось нечто, которое уже и показать не стыдно. Это нечто лежит на http://ifolder.ru/7012128. Кратко опишу, что из себя представляет проект.
А представляет он пока реализацию дискретной неэргодической HMM. HMM может сохранятся в файл формата xml, ну и загружаться оттуда естественно. Немного, но уже кое-что. Вместе с проектом идет примерчик как все это использовать. В качестве обучающей и тестовой последовательностей используются текстовые файлы, содержащие номера векторов кодовой книги. Эти номера получены после векторного квантования звуковых файлов TI Digits. Код квантователя пока в божеский вид не привел, поэтому не выкладываю На тестовой последовательности при числе состояний 7 и количестве символов 16 WER равен ~0,5%, что в принципе неплохо. Для каждого слова строилась своя кодовая книга. Вот так вот. может кому пригодится. PS: для сборки требуется boost и VS2005. Код распространяется без каких-либо ограничений. |
Сообщ.
#2
,
|
|
|
Добавил исходники под svn. Теперь они доступны по адресу http://speechlib.googlecode.com/svn/trunk
|
Сообщ.
#3
,
|
|
|
хм....
интересные результаты WER для дискретной модели... не планируете писать непрерывную? я сейчас пытаюсь - очень много подводных камней.... |
Сообщ.
#4
,
|
|
|
да непрерывная модель есть. Только ее код надо в порядок привести, а все никак руки не доходят К тому же я в настоящее время пишу классы для вычисления speech features (MFCC там всякие и т.п.).
|
Сообщ.
#5
,
|
|
|
да я хотябы на матлабе хочу чтоб заработало, там проще понять как и что протестировать и отладить..
а если начнет работать то и в Си потом портировать не долго... ну или блоки для симулинка наваять... а си плюсовых я вообще боюсь |
Сообщ.
#6
,
|
|
|
Цитата jackfrost @ да я хотябы на матлабе хочу чтоб заработало, там проще понять как и что протестировать и отладить.. а если начнет работать то и в Си потом портировать не долго... Матлаб работает раз в 30 медленнее сишной программы. Это же на пенсию выйдешь, прежде чем программа работать закончит (совсем уж тривиальные случаи не рассматриваем). |
Сообщ.
#7
,
|
|
|
ну это смотря как написать...
а на самом деле МАТЛАБ частенько почти даже догоняет Си... |
Сообщ.
#8
,
|
|
|
Реализованы алгоритмы построения кодовой книги K-Means и UWA
|
Сообщ.
#9
,
|
|
|
Как у вас успехи с реализацией? Вы сделали переоценку в логарифмическом масштабе?
я тоже сделал нечто аналогичное, вам удалось найти каки-нубудь простенькие базы для распознования цифр? не поделитесь? |
Сообщ.
#10
,
|
|
|
ну пока я пользовался для тестов базой TI-DIGITS. В принципе она доступна для скачивания в инете. Но если надо могу выложить.
|
Сообщ.
#11
,
|
|
|
Если не сложно, выложите куда-нибудь.
Как кстати успехи с цифрами? |
Сообщ.
#12
,
|
|
|
обработанную базу (файлы переименованы и разложены по папкам) можно скачать по адресу http://ifolder.ru/8141655. Оригинальная база думаю вам не сильно нужна.
|
Сообщ.
#13
,
|
|
|
Спасибо огромное! то что нужно для тестирования алгоритмов!
|
Сообщ.
#14
,
|
|
|
вот еще ссылка на страницу рабинера, откуда можно скачать некоторые речевые базы.
http://www.caip.rutgers.edu/~lrr |
Сообщ.
#15
,
|
|
|
Цитата phoenix367 @ обработанную базу (файлы переименованы и разложены по папкам) можно скачать по адресу http://ifolder.ru/8141655. Оригинальная база думаю вам не сильно нужна. А зачем же вы ее так "обработали"? Зачем отрезали начало и конец у каждого файла? |