На главную Наши проекты:
Журнал   ·   Discuz!ML   ·   Wiki   ·   DRKB   ·   Помощь проекту
ПРАВИЛА FAQ Помощь Участники Календарь Избранное RSS
msm.ru
Модераторы: RaD, nsh
  
> Создал работающий вариант детектора речи, начал заниматься обработкой
    Создал работающий вариант детектора речи, начал заниматься обработкой
      re: интересно какие признаки лежат в основе сего метода
        Цитата RaD @ 10.02.01, 17:54
        Создал работающий вариант детектора речи, начал заниматься обработкой

        здрасте

        было бы здорово если бы поделился исходником.
        и кстати уточни что обрабатываеш?
          Если уж не хочешь выкладывать исходники (а они очень бы пригодились - курсовую по теме писать надо), то хотя бы скинь пару ссылок по теории - буду очень благодарен.
            Посмотрите на дату сообщения, и вы Поймёте... ;)
              Метод самый простой, основан на переходе через ноль.
              Если правильно помню, что там были слова Zero Crossing.
              Подходит для простых распознавателей команд :)

              Сайт ts.kmc.ru + Google.
                Цитата RaD @ 18.05.04, 12:36
                Метод самый простой, основан на переходе через ноль.
                Если правильно помню, что там были слова Zero Crossing.

                Метод описан в :
                1.Методы автоматического распознавания речи. Под ред. У.Ли. М.Мир, 1983
                2.Цифровое представление речевых сигналов. Рабинер и Шафер. ТИИЭР №4, 1975, т.63

                А алгоритм за речь помехи всевозможные не принимает ?
                Например фоновый шум, образованный коктейль-эффектом (слышали наверное про такой) ?
                И как насчет борьбы с искажениями оценки, обусловленных наличием линейного тренда ?
                  Алгоритм древний, делается порог, начиная с которого хоть шум, хоть речь принимаются за полезный сигнал.
                  Сигнал накапливается в циклическом буфере.
                  Если он длится более секунды или около того, то передаём блоки из циклического буфера на дальнейшую обработку.
                  Если менее, то буфер сбрасывается ...

                  Хех, вот только не могу вспомнить, при чём тут Zero Crossing? :)
                    Цитата RaD,5.08.04, 13:11
                    Хех, вот только не могу вспомнить, при чём тут Zero Crossing? :)

                    Превышение порога -- это детектор по энергии
                    А zero-crossing -- это для оценки гласный (<3kHz) / согласный (>3kHz) /тишина вокруг (вапче ничего)
                    жаль что путает речь и шум, хотелось бы более серьезный алгоритм .....
                      У меня есть задумка определять не речь/шум/тишина, а фонемы (среди которых будут виды шума и тишина).

                      Это позволит упростить дальнейшую работу. Но дальше идеи это пока не сдвинулось.
                        Цитата RaD,6.08.04, 10:13
                        У меня есть задумка определять не речь/шум/тишина, а фонемы (среди которых будут виды шума и тишина).

                        Это позволит упростить дальнейшую работу. Но дальше идеи это пока не сдвинулось.

                        Я тоже дошел до подобной идеи. :wall:
                        правда экспериментальные исследования показывают, что вариабельность фонем и различие в свойствах несущего сигнала не позволяют создать конечный фонетический алфавит, поэтому рекомендуют оценивать для начала ГИПЕРПРИЗНАКИ -- основные черты, типа сильно-фрикативный, гласный, назальный, ... а потом уже строить статистическую модель слогов и слов.
                        вводные слова про я нашел у:
                        Венцов. Касевич. Современные модели воспритяия речи: критический обзор. - 13.3 Модель анализа через синтез.
                        на сайте www.csa.ru (правда там с кодировкой фигня творится, придется поколдовать Штирлицем)

                        .. может на самом деле заняться выделением групп специфических признаков и фильтрацией по ним ...
                        Сообщение отредактировано: Age -
                          Цитата
                          вводные слова про я нашел у:
                          Венцов. Касевич. Современные модели воспритяия речи: критический обзор. - 13.3 Модель анализа через синтез.
                          на сайте www.csa.ru (правда там с кодировкой фигня творится, придется поколдовать Штирлицем)


                          Дай прямую ссылку.
                            конкретно -- вот здесь (на содержание выйдешь самостоятельно)
                            http://www.csa.ru/DistanceLearning/course4/ch21/ch21_3.html

                            но я говорю, там какой то геморрой с кодировкой. у меня-то это в распечатке есть годичной давности..
                            успехов в раскодировании
                            1 пользователей читают эту тему (1 гостей и 0 скрытых пользователей)
                            0 пользователей:


                            Рейтинг@Mail.ru
                            [ Script execution time: 0,0285 ]   [ 14 queries used ]   [ Generated: 21.05.24, 07:31 GMT ]