Алгоритм распознавания речи -> Форум на Исходниках.Ру

	Наши проекты: Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту

Здравствуйте, Гость ! [3.139.238.76]

Модераторы: RaD, nsh

Новое голосование

Алгоритм распознавания речи , выбор алгоритма

rommag

Сообщ. #1 , 09.02.09, 19:22

Unregistered

Есть проблема выбора алгоритма распознавания речи, необходимо произвести анализ имеющихся алгоритмов и выбрать какой-то, и как результат представить программу, которая распознаёт несколько фиксированных слов от конкретного человека т.е. можно дикторозависимую.
Основных алгоритмов как я понял(может ошибаюсь) два. Один изложен на сайте http://speech-text.narod.ru/ с предварительной цифровой обработкой и поиском по технологии СММ.
Второй с помощью фонем, как я понял наиболее сложнореализуемый, но эффективный.
Какой алгоритм лучше использовать? Или есть более простые алгоритмы?

Анатоль

Сообщ. #2 , 09.02.09, 21:01

Full Member

Ungedonist	Сообщ. #23 , 08.10.09, 08:51
Unregistered	Анатоль Не мог бы ты предоставить сорцы своей программы распознавания? Я начал интерисоваться темой распознавания речи. Хотел бы поглядеть как устроена твоя программа, чтобы начать писать свою.

Анатоль	Сообщ. #24 , 08.10.09, 10:51
Full Member Профиль · PM Поощрения: 2 Dgm Рейтинг (т): 6	Цитата Ungedonist @ 08.10.09, 08:51 Не мог бы ты предоставить сорцы своей программы распознавания? А что такое "сорцы"?

MorSe	Сообщ. #25 , 08.10.09, 17:57
Junior Профиль · PM Рейтинг (т): 1	Цитата Анатоль @ 08.10.09, 10:51 А что такое "сорцы"? Исходные тексты программ

Анатоль	Сообщ. #26 , 08.10.09, 19:46
Full Member Профиль · PM Поощрения: 2 Dgm Рейтинг (т): 6	Ungedonist А что Вас интересует, весь исходник, или какой-то момент?

Ungedonist	Сообщ. #27 , 15.10.09, 20:11
Unregistered	Цитата Анатоль @ 08.10.09, 19:46 Ungedonist А что Вас интересует, весь исходник, или какой-то момент? меня интерисует как из непрерывного потока выбираются слова и распознаются они ведь всегда разные по длительности

Анатоль	Сообщ. #31 , 19.10.09, 04:36
Full Member Профиль · PM Поощрения: 2 Dgm Рейтинг (т): 6	Цитата Ungedonist @ 18.10.09, 18:14 То есть надо для каждого слова хранить ещё и последовательность фонем в слове? Вы о транскрипции? Ну да. Или хотя бы иметь правила, как эту(эти) последовательность получить.

Ungedonist	Сообщ. #32 , 19.10.09, 09:50
Unregistered	Можно взгдянуть на то, как у тебя реализовано распознавание речи, начиная от самого начала? Так будет наглядней, понятнее. А то я наверно тебе уже надоел своими вопросами

Анатоль	Сообщ. #33 , 19.10.09, 11:34
Full Member Профиль · PM Поощрения: 2 Dgm Рейтинг (т): 6	Ungedonist А Вы выложите тут свою распознавалку?

Ungedonist	Сообщ. #34 , 19.10.09, 13:23
Unregistered	Цитата Анатоль @ 19.10.09, 11:34 Ungedonist А Вы выложите тут свою распознавалку? Когда всё сделаю, тогда выложу! Быть может, это кому-то поможет. Данная тема является темой моего диплома, вот и хочу сделать что-то стоящее)

Анатоль	Сообщ. #35 , 19.10.09, 16:31
Full Member Профиль · PM Поощрения: 2 Dgm Рейтинг (т): 6	Ну что ж, давайте сделаем такой прецедент. Может ещё кто-то поддержит. Даю исходник "Васи".(REC42U.zip) Прикреплённый файлRec42U.zip (7.11 Кбайт, скачиваний: 804)

Ungedonist	Сообщ. #36 , 20.10.09, 21:02
Unregistered	большое спасибо

Анатоль	Сообщ. #44 , 08.11.09, 18:32
Full Member Профиль · PM Поощрения: 2 Dgm Рейтинг (т): 6	Цитата Black*Eternal @ 08.11.09, 17:59 когда мы подаём на вход один слог и на выходе пытаемся получить ответ, что это за слог? Вы собираетесь вручную определять границы слога? Тогда что Вам мешает вручную задать и границы фонем?

Анатоль	Сообщ. #46 , 08.11.09, 20:41
Full Member Профиль · PM Поощрения: 2 Dgm Рейтинг (т): 6	Цитата Black*Eternal @ 08.11.09, 19:02 ну как.. у меня же в начале только один слог и будет на входе Еще тишина будет. Слог от тишины как-то надо отличить. Вручную?

PrisonGrigory	Сообщ. #51 , 11.12.09, 14:39
Unregistered	Ребят, скиньте хоть какой нибудь работающий исходник с распознованем, мне надо десять слов всего распознать, вот майл prisonsoad@mail.ru, буду очень благодарен!

Ungedonist	Сообщ. #54 , 18.02.10, 14:44
Unregistered	Как и обещал Анатолю, выкладываю свой код. Его код вообще не использовал, программа ещё очень сыра и требует серьёзной доработки. Но может быть кому-нибудь пригодится http://slil.ru/28670569

Анатоль	Сообщ. #56 , 18.02.10, 20:17
Full Member Профиль · PM Поощрения: 2 Dgm Рейтинг (т): 6	Ungedonist, не грузится у меня оттуда Ваш файл. Почему Вы его здесь не разместите?

Haze	Сообщ. #57 , 03.03.10, 09:16
Member Профиль · PM Поощрения: 1 Dgm Рейтинг (т): 3	Подскажите, каков принцип работы систем распознавания речи, которые обучаются не на базе с пофонемной разметкой, а - пословной. Есть ли такие системы вообще? Что можно почитать по этому поводу?

MorSe	Сообщ. #58 , 05.03.10, 20:21
Junior Профиль · PM Рейтинг (т): 1	Haze Dynamic Time Warping - метод распознавания изолированных слов с использованием динамического программирования.

Haze	Сообщ. #59 , 05.03.10, 20:32
Member Профиль · PM Поощрения: 1 Dgm Рейтинг (т): 3	MorSe Спасибо.

walter-simons	Сообщ. #60 , 05.03.10, 20:34
Unregistered	Так возможно написать маленький модуль, распознающий всего одну фонему но распознающий ее с 90% точностью независимо от пола, возраста, помех и искажений?

Haze	Сообщ. #61 , 05.03.10, 20:46
Member Профиль · PM Поощрения: 1 Dgm Рейтинг (т): 3	Цитата walter-simons @ 05.03.10, 20:34 независимо от помех и искажений Смотря какие помехи и искажения, если вызванные прохождением сигнала через телефонный тракт (или что-то подобное), то 90% точности - реальная число.

walter-simons	Сообщ. #62 , 05.03.10, 21:09
Unregistered	Искажения типа: голос звучит издалека, идет фоном музыка негромкая или проезжают автомобили. Если это возможно, кто возьмется написать такой модуль, выхватывающий фонему?

walter-simons	Сообщ. #69 , 07.03.10, 19:04
Unregistered	Да, возможно, но все это нюансы. Так есть такая программа, кто может написать, хотя бы ради эксперименты?

MedEx	Сообщ. #70 , 08.03.10, 10:05
Senior Member Профиль · PM Рейтинг (т): 56	walter-simons а зачем интересуетесь?

walter-simons	Сообщ. #71 , 08.03.10, 10:35
Unregistered	Честно? Хочу инициировать революцию в обработке информации. Без личной выгоды.

nsh	Сообщ. #77 , 09.03.10, 19:07
Moderator Профиль · PM	Цитата пофонемное распознавание дело нехитрое но есть одно "но",оно дикторозависимое и требует специальных условий и длительной настройки-тренировки под пользователя. С такими высказываниями нужно быть осторожнее

walter-simons	Сообщ. #81 , 19.03.10, 20:06
Unregistered	Roman55555! Конечно выкладывай!

Evgeniyuser	Сообщ. #85 , 05.07.11, 03:06
Unregistered	Здравствуйте, Roman55555. Появилось ли за год что-нибудь нового по данной теме?

zamir	Сообщ. #86 , 05.07.11, 06:29
Full Member Профиль · PM Поощрения: 1 Dgm Рейтинг (т): 9	Evgeniyuser, чем вас cmu-sphinx не устраивает как готовое и открытое решение для распознования речи? p.s. на сколько я вижу roman55555 Unregistered Сообщение отредактировано: zamir - 05.07.11, 06:30

Evgeniyuser	Сообщ. #87 , 05.07.11, 07:38
Unregistered	zamir А если точить под свои нужды? Я понял, что нужно использовать Java? А на С# пойдет?