Конструкция речевых сигналов. -> Форум на Исходниках.Ру

	Наши проекты: Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту

Здравствуйте, Гость ! [216.73.216.198]

Модераторы: RaD, nsh

Новое голосование

Конструкция речевых сигналов.

IVVI

Сообщ. #1 , 16.04.17, 18:06

Newbie

Профиль · PM

Рейтинг (т): 1

Я интересуюсь (и занимаюсь) дикторонезависимым распознаванием отдельных слов (числительные, произнесенные голосом, шепотом и с фильтрацией) с целью обнаружить общие признаки в разных по спектру
речевых сигналах. Несколько образцов речевого материала находятся в прилагаемых звуковых файлах
(11025 гц, 16 бит, моно, без справочной информации). Прослушать их можно демо-программой IRID.EXE.
Справку можно получить по клавише F1 сразу после запуска программы. Хотелось бы получить сравнительную
оценку от работающих в этом направлении. С удовольствием посмотрел бы ответные звуковые файлы. Буду
благодарен ответившим. Моя почта: ivvi05@yandex.ru.
PS. Полный пакет далеко не укладывается в 100кб, поэтому изьял 6 звуковых файлов, остался только
один. Может быть потом удастся добавить их.

Сообщение отредактировано: nsh - 16.04.17, 21:17

nsh

Сообщ. #2 , 16.04.17, 21:19

Moderator

Профиль · PM

Цитата IVVI @ 16.04.17, 18:06

Хотелось бы получить сравнительную
оценку от работающих в этом направлении.

Чего оценивать-то? Ну записи какие-то.

Цитата

Несколько образцов речевого материала находятся в прилагаемых звуковых файлах
(11025 гц, 16 бит, моно, без справочной информации). Прослушать их можно демо-программой IRID.EXE.

Детский сад какой-то. Программу удалил. Если надо выложить звук - выкладывайте в WAV, чем послушать их, мы найдём.

IVVI	Сообщ. #3 , 17.04.17, 04:10
Newbie Профиль · PM Рейтинг (т): 1	Добрый день nsh! Я полагаю, что у Вас есть программа распознавания речи. Подайте ей мой звуковой файл. Если опознаны все слова - отлично! Такую оценку я хотел получить. Прикреплённый файлir11.rar (90,91 Кбайт, скачиваний: 1061)

IVVI	Сообщ. #4 , 20.04.17, 10:11
Newbie Профиль · PM Рейтинг (т): 1	Добавляю второй файл IW01 (без расширения), записанный с сильным шумовым фоном.

IVVI	Сообщ. #5 , 20.04.17, 10:27
Newbie Профиль · PM Рейтинг (т): 1	Извините, архивный файл не прошел по размеру. Мой demo-пакет имеет 700кб и предложить его желающим через форум оказалось не просто. Моя почта: IVVI05@YANDEX.RU, могу выслать.

IVVI	Сообщ. #6 , 13.08.17, 13:28
Newbie Профиль · PM Рейтинг (т): 1	Еще попытка прикрепить архивный файл. Прикреплённый файлIR01.rar (92,34 Кбайт, скачиваний: 1107)

IVVI	Сообщ. #7 , 07.11.17, 17:43
Newbie Профиль · PM Рейтинг (т): 1	Шепотный вариант. Прикреплённый файлIR111b.rar (55,52 Кбайт, скачиваний: 1041) Прикреплённый файлIR111w.rar (88,75 Кбайт, скачиваний: 1032)

IVVI	Сообщ. #8 , 28.01.18, 17:03
Newbie Профиль · PM Рейтинг (т): 1	Голосовой вариант, разные дикторы. Прикреплённый файлIR112b.rar (45,29 Кбайт, скачиваний: 1047) Прикреплённый файлIR112w.rar (81,95 Кбайт, скачиваний: 1057)

IVVI	Сообщ. #9 , 17.03.18, 12:41
Newbie Профиль · PM Рейтинг (т): 1	Как можно опознать звук 'ноль'. Прикреплённый файлIR115.rar (76,88 Кбайт, скачиваний: 1022)

IVVI

Сообщ. #10 , 23.06.18, 13:59

Newbie

Профиль · PM

Рейтинг (т): 1

Пример слитной фразы 'мамамылараму', две реализации от разных типов
микрофонов (электродинамический и пьезо). Внизу представлена фрагмен-
тация программой реализаций на фонемные участки. Пунктирные линии -
паузы, зеленые - согласные, синие - гласные. Гласных звуков всего три.
Четыре повторения гласной 'а' в каждой из реализаций имеют разные АЧХ,
трудно сопоставить им один эталон. Самая нижняя кривая - поведение пе-
риода основного тона. На участках гласных она относительно гладкая и
имеет выбросы при смене артикуляции.
Прикреплённый файл

IR117.rar (90,15 Кбайт, скачиваний: 1041)

IVVI

Сообщ. #11 , 26.08.18, 19:37

Newbie

Профиль · PM

Рейтинг (т): 1

Достаточный интерес представляет и эта фраза. При обратном ее воспроизведении программа делает
только 4 ошибки на нормальном темпе и 8 на ускоренном.
Прикреплённый файл

IR118b.rar (40,07 Кбайт, скачиваний: 1004)
Прикреплённый файл

IR118w.rar (76,5 Кбайт, скачиваний: 1031)

IVVI

Сообщ. #12 , 11.11.18, 06:54

Newbie

Профиль · PM

Рейтинг (т): 1

Свою поделку продолжаю, советов бросить пока нет, а уверенность в успехе растет (как и наша экономика).
Начинал с цифр и много времени ушло на это. Зато появилось представление как работать с речевыми
сигналами (включая шепотную речь). Теперь стали доступны практически любые фразы, что демонстрирует
последний пример. Однако, камнем преткновения продолжает оставаться стабильность опознания и эта проблема становится главной. В программе приоритет у фонетики (как сказано и что) и конфликты с орфографией пока не актуальны. Может кому-нибудь мои примеры пригодятся.
Прикреплённый файл

IR119b.rar (44,11 Кбайт, скачиваний: 1009)
Прикреплённый файл

IR119w.rar (88,61 Кбайт, скачиваний: 1016)

IVVI	Сообщ. #13 , 20.01.19, 16:38
Newbie Профиль · PM Рейтинг (т): 1	Как можно опознать звуки 'при' - 'три'. Прикреплённый файлIR120b.rar (42,77 Кбайт, скачиваний: 1008) Прикреплённый файлIR120w.rar (82,29 Кбайт, скачиваний: 996)

zamir	Сообщ. #14 , 26.01.19, 05:42
Full Member Профиль · PM Поощрения: 1 Dgm Рейтинг (т): 9	Владимир, так что за модели вы используете?

IVVI	Сообщ. #15 , 27.01.19, 18:39
Newbie Профиль · PM Рейтинг (т): 1	Модель своя, начатая еще в 1974 году на ЭВМ 'Минск-22'.

1 пользователей читают эту тему (1 гостей и 0 скрытых пользователей)

0 пользователей:

Страницы: (2) [1] 2 все

[ Script execution time: 0,0706 ] [ 32 queries used ] [ Generated: 1.07.25, 04:47 GMT ]