Пример реализации HMM -> Форум на Исходниках.Ру

	Наши проекты: Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту

Здравствуйте, Гость ! [216.73.217.58]

Модераторы: RaD, nsh

Новое голосование

Пример реализации HMM

phoenix367

Сообщ. #1 , 17.06.08, 18:43

Member

Профиль · PM

Рейтинг (т): 6

Вот потихоньку пишу свою библиотечку. Появилось нечто, которое уже и показать не стыдно. Это нечто лежит на http://ifolder.ru/7012128. Кратко опишу, что из себя представляет проект.

А представляет он пока реализацию дискретной неэргодической HMM. HMM может сохранятся в файл формата xml, ну и загружаться оттуда естественно. Немного, но уже кое-что. Вместе с проектом идет примерчик как все это использовать. В качестве обучающей и тестовой последовательностей используются текстовые файлы, содержащие номера векторов кодовой книги. Эти номера получены после векторного квантования звуковых файлов TI Digits. Код квантователя пока в божеский вид не привел, поэтому не выкладываю

На тестовой последовательности при числе состояний 7 и количестве символов 16 WER равен ~0,5%, что в принципе неплохо. Для каждого слова строилась своя кодовая книга.

Вот так вот. может кому пригодится.
PS: для сборки требуется boost и VS2005. Код распространяется без каких-либо ограничений.

phoenix367	Сообщ. #2 , 20.06.08, 21:30
Member Профиль · PM Рейтинг (т): 6	Добавил исходники под svn. Теперь они доступны по адресу http://speechlib.googlecode.com/svn/trunk

jackfrost	Сообщ. #3 , 16.07.08, 09:31
Member Профиль · PM Рейтинг (т): нет	хм.... интересные результаты WER для дискретной модели... не планируете писать непрерывную? я сейчас пытаюсь - очень много подводных камней....

phoenix367	Сообщ. #4 , 16.07.08, 10:49
Member Профиль · PM Рейтинг (т): 6	да непрерывная модель есть. Только ее код надо в порядок привести, а все никак руки не доходят К тому же я в настоящее время пишу классы для вычисления speech features (MFCC там всякие и т.п.).

jackfrost

Сообщ. #5 , 16.07.08, 14:40

Member

Профиль · PM

Рейтинг (т): нет

да я хотябы на матлабе хочу чтоб заработало, там проще понять как и что протестировать и отладить..
а если начнет работать то и в Си потом портировать не долго...
ну или блоки для симулинка наваять...

а си плюсовых я вообще боюсь

phoenix367

Сообщ. #6 , 16.07.08, 19:09

Member

Профиль · PM

Рейтинг (т): 6

Цитата jackfrost @ 16.07.08, 14:40

да я хотябы на матлабе хочу чтоб заработало, там проще понять как и что протестировать и отладить..
а если начнет работать то и в Си потом портировать не долго...

Матлаб работает раз в 30 медленнее сишной программы. Это же на пенсию выйдешь, прежде чем программа работать закончит

(совсем уж тривиальные случаи не рассматриваем).

jackfrost	Сообщ. #7 , 17.07.08, 08:02
Member Профиль · PM Рейтинг (т): нет	ну это смотря как написать... а на самом деле МАТЛАБ частенько почти даже догоняет Си...

phoenix367	Сообщ. #8 , 27.07.08, 20:24
Member Профиль · PM Рейтинг (т): 6	Реализованы алгоритмы построения кодовой книги K-Means и UWA

jackfrost	Сообщ. #9 , 12.09.08, 08:08
Member Профиль · PM Рейтинг (т): нет	Как у вас успехи с реализацией? Вы сделали переоценку в логарифмическом масштабе? я тоже сделал нечто аналогичное, вам удалось найти каки-нубудь простенькие базы для распознования цифр? не поделитесь?

phoenix367	Сообщ. #10 , 12.09.08, 20:24
Member Профиль · PM Рейтинг (т): 6	ну пока я пользовался для тестов базой TI-DIGITS. В принципе она доступна для скачивания в инете. Но если надо могу выложить.

jackfrost	Сообщ. #11 , 13.09.08, 19:15
Member Профиль · PM Рейтинг (т): нет	Если не сложно, выложите куда-нибудь. Как кстати успехи с цифрами?

phoenix367	Сообщ. #12 , 15.09.08, 17:56
Member Профиль · PM Рейтинг (т): 6	обработанную базу (файлы переименованы и разложены по папкам) можно скачать по адресу http://ifolder.ru/8141655. Оригинальная база думаю вам не сильно нужна.

jackfrost	Сообщ. #13 , 15.09.08, 19:21
Member Профиль · PM Рейтинг (т): нет	Спасибо огромное! то что нужно для тестирования алгоритмов!

phoenix367	Сообщ. #14 , 15.09.08, 21:24
Member Профиль · PM Рейтинг (т): 6	вот еще ссылка на страницу рабинера, откуда можно скачать некоторые речевые базы. http://www.caip.rutgers.edu/~lrr

KoPoBuH

Сообщ. #15 , 15.09.08, 22:35

Full Member

Профиль · PM

Поощрения: 1 Dgm

Рейтинг (т): 4

Цитата phoenix367 @ 15.09.08, 17:56

обработанную базу (файлы переименованы и разложены по папкам) можно скачать по адресу http://ifolder.ru/8141655. Оригинальная база думаю вам не сильно нужна.

А зачем же вы ее так "обработали"? Зачем отрезали начало и конец у каждого файла?

nsh

Сообщ. #16 , 16.09.08, 07:16

Moderator

Профиль · PM

Чтобы народ в заблуждение не вводить, я бы не стал эту базу tidigits называть. А то, получается что и результаты путаются. в базе TIDIGITS последовательности цифр, а не изолированные цифры:

http://www.ldc.upenn.edu/Catalog/docs/LDC93S10/readme.txt

Хотя по размеру она примерно такая-же.

Сообщение отредактировано: nsh - 16.09.08, 09:06

phoenix367	Сообщ. #17 , 16.09.08, 07:59
Member Профиль · PM Рейтинг (т): 6	А, ну судя по описанию - у меня урезанная версия, где оставлены только изолированные цифры.

KoPoBuH	Сообщ. #18 , 16.09.08, 10:45
Full Member Профиль · PM Поощрения: 1 Dgm Рейтинг (т): 4	Это четверть от исходной базы данных да еще и "обработанная"

phoenix367	Сообщ. #19 , 16.09.08, 12:30
Member Профиль · PM Рейтинг (т): 6	Так если не нравится - не пользуйтесь. В чем проблема?

jackfrost	Сообщ. #20 , 16.09.08, 12:40
Member Профиль · PM Рейтинг (т): нет	Отличная база, кусок TIDIGITS видимо. Ничего лучшего пока никто не предложил, KoPoBuH у вас есть полный TIDIGITS? прошу, выкладывайте...

KoPoBuH

Сообщ. #21 , 16.09.08, 13:13

Full Member

Профиль · PM

Поощрения: 1 Dgm

Рейтинг (т): 4

Цитата phoenix367 @ 16.09.08, 12:30

Так если не нравится - не пользуйтесь. В чем проблема?

Моя позиция простая - если есть исходный материал и ты готов вы выложить, то раздавать нужно в исходном виде, а не огрызки. И не мешать в одну кучу женщин и мужчин. Ну конечно "в исходном" не подразумевает убогий исходный формат. Минимальное преобразование нужно сделать. Как то преобразовать в WAVE формат и пересэмплировать на стандартную частоту.

Полная база занимает 700 Мб. К сожалению я не могу ее выложить по некоторым причинам.

Сообщение отредактировано: KoPoBuH - 16.09.08, 14:05

Hobbit

Сообщ. #22 , 01.10.08, 15:53

Unregistered

Пытаюсь разобраться в СММ, поэтому есть некоторые вопросы, может кто-нибудь подскажет? Так и не понял матрица вероятностей переходов для СММ является заданной /как в случае открытой ММ/ или ее как раз и нужно найти через вероятности появления параметров цепи. ПС Имеющаяся литература подзапутала сознание.

phoenix367	Сообщ. #23 , 02.10.08, 10:27
Member Профиль · PM Рейтинг (т): 6	Матрица переходов находится в процессе оценки параметров модели. Я же вроде выкладывал статью на эту тему. Она на русском даже.

Born55

Сообщ. #24 , 05.12.13, 10:08

Unregistered

Цитата phoenix367 @ 15.09.08, 17:56

Приветствую всех! Народ, у кого есть эта база обрезанных цифр перезалейте плиз, а то эта ссылка (http://ifolder.ru/8141655) не робит уже! :help:

Добавлено 05.12.13, 10:10

Цитата phoenix367 @ 17.06.08, 18:43

И это если можно тоже.!

Born55	Сообщ. #25 , 12.12.13, 08:40
Unregistered	Что не у кого нету? Или всем пофиг?

phoenix367	Сообщ. #26 , 25.01.14, 21:48
Member Профиль · PM Рейтинг (т): 6	Базу с цифрами можно скачать по этой ссылке http://www.ece.ucsb.edu/Faculty/Rabiner/ece259/

0 пользователей читают эту тему (0 гостей и 0 скрытых пользователей)

0 пользователей:

[ Script execution time: 0.0932 ] [ 15 queries used ] [ Generated: 2.07.26, 14:51 GMT ]