На главную
ПРАВИЛА FAQ Помощь Участники Календарь Избранное DigiMania RSS
msm.ru
Модераторы: RaD, nsh
  
> Конструкция речевых сигналов.
    Я интересуюсь (и занимаюсь) дикторонезависимым распознаванием отдельных слов (числительные, произнесенные голосом, шепотом и с фильтрацией) с целью обнаружить общие признаки в разных по спектру
    речевых сигналах. Несколько образцов речевого материала находятся в прилагаемых звуковых файлах
    (11025 гц, 16 бит, моно, без справочной информации). Прослушать их можно демо-программой IRID.EXE.
    Справку можно получить по клавише F1 сразу после запуска программы. Хотелось бы получить сравнительную
    оценку от работающих в этом направлении. С удовольствием посмотрел бы ответные звуковые файлы. Буду
    благодарен ответившим. Моя почта: ivvi05@yandex.ru.
    PS. Полный пакет далеко не укладывается в 100кб, поэтому изьял 6 звуковых файлов, остался только
    один. Может быть потом удастся добавить их.
    Сообщение отредактировано: nsh -
      Цитата IVVI @
      Хотелось бы получить сравнительную
      оценку от работающих в этом направлении.


      Чего оценивать-то? Ну записи какие-то.

      Цитата
      Несколько образцов речевого материала находятся в прилагаемых звуковых файлах
      (11025 гц, 16 бит, моно, без справочной информации). Прослушать их можно демо-программой IRID.EXE.


      Детский сад какой-то. Программу удалил. Если надо выложить звук - выкладывайте в WAV, чем послушать их, мы найдём.
      http://nshmyrev.blogspot.com
        Добрый день nsh! Я полагаю, что у Вас есть программа распознавания речи. Подайте ей мой звуковой файл.
        Если опознаны все слова - отлично! Такую оценку я хотел получить.
        Прикреплённый файлПрикреплённый файлir11.rar (90,91 Кбайт, скачиваний: 40)
          Добавляю второй файл IW01 (без расширения), записанный с сильным шумовым фоном.
            Извините, архивный файл не прошел по размеру. Мой demo-пакет имеет 700кб и предложить его желающим
            через форум оказалось не просто. Моя почта: IVVI05@YANDEX.RU, могу выслать.
              Еще попытка прикрепить архивный файл.
              Прикреплённый файлПрикреплённый файлIR01.rar (92,34 Кбайт, скачиваний: 35)
                Шепотный вариант.
                Прикреплённый файлПрикреплённый файлIR111b.rar (55,52 Кбайт, скачиваний: 17)
                Прикреплённый файлПрикреплённый файлIR111w.rar (88,75 Кбайт, скачиваний: 19)
                  Голосовой вариант, разные дикторы.
                  Прикреплённый файлПрикреплённый файлIR112b.rar (45,29 Кбайт, скачиваний: 14)
                  Прикреплённый файлПрикреплённый файлIR112w.rar (81,95 Кбайт, скачиваний: 12)
                    Как можно опознать звук 'ноль'.
                    Прикреплённый файлПрикреплённый файлIR115.rar (76,88 Кбайт, скачиваний: 11)
                      Пример слитной фразы 'мамамылараму', две реализации от разных типов
                      микрофонов (электродинамический и пьезо). Внизу представлена фрагмен-
                      тация программой реализаций на фонемные участки. Пунктирные линии -
                      паузы, зеленые - согласные, синие - гласные. Гласных звуков всего три.
                      Четыре повторения гласной 'а' в каждой из реализаций имеют разные АЧХ,
                      трудно сопоставить им один эталон. Самая нижняя кривая - поведение пе-
                      риода основного тона. На участках гласных она относительно гладкая и
                      имеет выбросы при смене артикуляции.
                      Прикреплённый файлПрикреплённый файлIR117.rar (90,15 Кбайт, скачиваний: 6)
                      1 пользователей читают эту тему (1 гостей и 0 скрытых пользователей)
                      0 пользователей:


                      Рейтинг@Mail.ru
                      [ Script Execution time: 0,0861 ]   [ 26 queries used ]   [ Generated: 22.07.18, 01:27 GMT ]