На главную Наши проекты:
Журнал   ·   Discuz!ML   ·   Wiki   ·   DRKB   ·   Помощь проекту
ПРАВИЛА FAQ Помощь Участники Календарь Избранное RSS
msm.ru
Модераторы: RaD, nsh
Страницы: (2) [1] 2  все  ( Перейти к последнему сообщению )  
> Конструкция речевых сигналов.
    Я интересуюсь (и занимаюсь) дикторонезависимым распознаванием отдельных слов (числительные, произнесенные голосом, шепотом и с фильтрацией) с целью обнаружить общие признаки в разных по спектру
    речевых сигналах. Несколько образцов речевого материала находятся в прилагаемых звуковых файлах
    (11025 гц, 16 бит, моно, без справочной информации). Прослушать их можно демо-программой IRID.EXE.
    Справку можно получить по клавише F1 сразу после запуска программы. Хотелось бы получить сравнительную
    оценку от работающих в этом направлении. С удовольствием посмотрел бы ответные звуковые файлы. Буду
    благодарен ответившим. Моя почта: ivvi05@yandex.ru.
    PS. Полный пакет далеко не укладывается в 100кб, поэтому изьял 6 звуковых файлов, остался только
    один. Может быть потом удастся добавить их.
    Сообщение отредактировано: nsh -
      Цитата IVVI @
      Хотелось бы получить сравнительную
      оценку от работающих в этом направлении.


      Чего оценивать-то? Ну записи какие-то.

      Цитата
      Несколько образцов речевого материала находятся в прилагаемых звуковых файлах
      (11025 гц, 16 бит, моно, без справочной информации). Прослушать их можно демо-программой IRID.EXE.


      Детский сад какой-то. Программу удалил. Если надо выложить звук - выкладывайте в WAV, чем послушать их, мы найдём.
        Добрый день nsh! Я полагаю, что у Вас есть программа распознавания речи. Подайте ей мой звуковой файл.
        Если опознаны все слова - отлично! Такую оценку я хотел получить.
        Прикреплённый файлПрикреплённый файлir11.rar (90,91 Кбайт, скачиваний: 984)
          Добавляю второй файл IW01 (без расширения), записанный с сильным шумовым фоном.
            Извините, архивный файл не прошел по размеру. Мой demo-пакет имеет 700кб и предложить его желающим
            через форум оказалось не просто. Моя почта: IVVI05@YANDEX.RU, могу выслать.
              Еще попытка прикрепить архивный файл.
              Прикреплённый файлПрикреплённый файлIR01.rar (92,34 Кбайт, скачиваний: 1024)
                Шепотный вариант.
                Прикреплённый файлПрикреплённый файлIR111b.rar (55,52 Кбайт, скачиваний: 960)
                Прикреплённый файлПрикреплённый файлIR111w.rar (88,75 Кбайт, скачиваний: 960)
                  Голосовой вариант, разные дикторы.
                  Прикреплённый файлПрикреплённый файлIR112b.rar (45,29 Кбайт, скачиваний: 969)
                  Прикреплённый файлПрикреплённый файлIR112w.rar (81,95 Кбайт, скачиваний: 978)
                    Как можно опознать звук 'ноль'.
                    Прикреплённый файлПрикреплённый файлIR115.rar (76,88 Кбайт, скачиваний: 947)
                      Пример слитной фразы 'мамамылараму', две реализации от разных типов
                      микрофонов (электродинамический и пьезо). Внизу представлена фрагмен-
                      тация программой реализаций на фонемные участки. Пунктирные линии -
                      паузы, зеленые - согласные, синие - гласные. Гласных звуков всего три.
                      Четыре повторения гласной 'а' в каждой из реализаций имеют разные АЧХ,
                      трудно сопоставить им один эталон. Самая нижняя кривая - поведение пе-
                      риода основного тона. На участках гласных она относительно гладкая и
                      имеет выбросы при смене артикуляции.
                      Прикреплённый файлПрикреплённый файлIR117.rar (90,15 Кбайт, скачиваний: 973)
                        Достаточный интерес представляет и эта фраза. При обратном ее воспроизведении программа делает
                        только 4 ошибки на нормальном темпе и 8 на ускоренном.
                        Прикреплённый файлПрикреплённый файлIR118b.rar (40,07 Кбайт, скачиваний: 927)
                        Прикреплённый файлПрикреплённый файлIR118w.rar (76,5 Кбайт, скачиваний: 956)
                          Свою поделку продолжаю, советов бросить пока нет, а уверенность в успехе растет (как и наша экономика).
                          Начинал с цифр и много времени ушло на это. Зато появилось представление как работать с речевыми
                          сигналами (включая шепотную речь). Теперь стали доступны практически любые фразы, что демонстрирует
                          последний пример. Однако, камнем преткновения продолжает оставаться стабильность опознания и эта проблема становится главной. В программе приоритет у фонетики (как сказано и что) и конфликты с орфографией пока не актуальны. Может кому-нибудь мои примеры пригодятся.
                          Прикреплённый файлПрикреплённый файлIR119b.rar (44,11 Кбайт, скачиваний: 933)
                          Прикреплённый файлПрикреплённый файлIR119w.rar (88,61 Кбайт, скачиваний: 942)
                            Как можно опознать звуки 'при' - 'три'.
                            Прикреплённый файлПрикреплённый файлIR120b.rar (42,77 Кбайт, скачиваний: 941)
                            Прикреплённый файлПрикреплённый файлIR120w.rar (82,29 Кбайт, скачиваний: 915)
                              Владимир, так что за модели вы используете?
                                Модель своя, начатая еще в 1974 году на ЭВМ 'Минск-22'.
                                0 пользователей читают эту тему (0 гостей и 0 скрытых пользователей)
                                0 пользователей:


                                Рейтинг@Mail.ru
                                [ Script execution time: 0,0352 ]   [ 34 queries used ]   [ Generated: 19.03.24, 10:39 GMT ]