На главную Наши проекты:
Журнал   ·   Discuz!ML   ·   Wiki   ·   DRKB   ·   Помощь проекту
ПРАВИЛА FAQ Помощь Участники Календарь Избранное RSS
msm.ru
Модераторы: RaD, nsh
Страницы: (15) « Первая ... 9 10 [11] 12 13 ... Последняя » все  ( Перейти к последнему сообщению )  
> Фонемное распознавание речи
    Цитата Hobbit @
    имелись ввиду первые 4-5

    Цитата Hobbit @
    в каком диапазоне частот АЧХ имеет максимумы? Не в области ли ВЧ по отношения к первой строке?

    Нет, не в этой области. Частота 4-5-й гармоники может совпадать с частотой второй форманты. А основной тон может находиться в той же частотной области, что и первая форманта, поэтому область формант не является более высокочастотной.
    Цитата Hobbit @
    Можно чуть подетальнее объяснить?

    Если Вы употребляете понятие "область форманты", то значит Вы понимаете, что это такое, и у Вас не должно быть сложностей при вычислении средней частоты в этой области.
    Сообщение отредактировано: kaa1 -
      У кого-нибудь есть программа Raw Waveform?
      Прикреплённый файлПрикреплённый файлРисунок2.jpg (84.69 Кбайт, скачиваний: 636)
        Ничего, что не в тему запостили ;) ?

        Это не программа называется Raw Waveform, это окошко называется так. А программа какая-то наша самописная судя по всему. Гораздо проще скачать Wavesurfer, там всё такое же есть:

        http://www.speech.kth.se/wavesurfer/download.html
          Цитата nsh @
          Ничего, что не в тему запостили ;) ?

          Это не программа называется Raw Waveform, это окошко называется так. А программа какая-то наша самописная судя по всему. Гораздо проще скачать Wavesurfer, там всё такое же есть:

          http://www.speech.kth.se/wavesurfer/download.html

          Просто эта программа позволяет выделить фонемы (судя по указанным в этом окошке вверху фонемам "Вы мне писали"), я и подумала, что сюда можно писать. :huh:
          Есть у меня Wavesurfer, но как в ней получить разбиение слов на фонемы (как в том окошке вверху)?
            Это ручное выделение, если Вас это интересует. В Wavesurfer на панели щёлкаете правой кнопкой мыши - Add Pane->Transcription. Добавляется полоска с транскрипцией. На ней щёлкаете - Insert Label, двигаете метку, потом снова правой кнопой - Save All Labels. Сохраняете транскрипцию.

            Добавлено
            P.S. Ни одна программа так точно границы пока искать не может :)

            Добавлено
            Хотя нет, не так точно, на картинке после с перед а слишком рано граница :)
              Получается, что это мы сами пишем названия фонем. А я подумала, что программа сама выводит их, т.е. распознает. :o

              Я изучаю вопрос распознавания речи по спектрограмме. Получила спектрограммы разных звуков, получается, что совершенно разные фонемы почти не отличаются друг от друга. Как тогда вообще распознавать?
                Ну как, про это целые книги написаны.

                Вводную информацию можно посмотреть в энциклопедиях и поискать в сети, вроде

                http://en.wikipedia.org/wiki/Speech_recognition

                А более подробно нужно изучать по книге, вроде SLP:

                http://festlang.berlios.de/docu/doku.php?id=speech_tech_faq&s=spoken

                Добавлено
                А по спектрограмме специалист распознавать звуки может, конечно. Но для этого опыт нужен. Немного про это описано в
                книжке Кривновой "Общая фонетика", например, из доступного в сети:

                http://www.philol.msu.ru/~otipl/SpeechGroup/publications/krivnova-2001-2004/glava11.doc

                ну и на английском литературы полно, например

                http://home.cc.umanitoba.ca/~robh/howto.html

                Вобщем, если вы проблему уточните, можно будет и литературу подходящую подыскать.
                  nsh, спасибо за ссылки. Жаль, что все материалы на английском.
                  Из второй ссылки книги Spoken Language Processing vol. 1 и 2 не открываются или это только у меня?
                    Надо установить плагин для IE или просмотрщик djvu:

                    http://djvu.sourceforge.net/

                    Добавлено
                    Ну и вот это ещё стоит про спектрограммы поглядеть:

                    http://cslu.cse.ogi.edu/tutordemos/SpectrogramReading/spectrogram_reading.html
                    http://www.chass.utoronto.ca/~danhall/lin228/acoustics.html
                    http://arse.sourceforge.net/examples.shtml

                    И, если удастся:

                    Ladefoged, Peter: A Course In Phonetics: Third Edition, page 60. Harcourt Brace College Publishers, 1993
                      Спасибо за ссылки!

                      Проблема заключается в распознавании речи именно по спектрограмме.

                      За Кривнову спасибо.
                      Есть ли у кого-нибудь работы Зиновьевой Н.В? Например, Зиновьева Н.В. Система акустических ключей к распознаванию фонетических единиц русского языка?
                        Лет десять назад я писал обзор по автоматическому распознаванию речи для одной фирмы, кусок из которого привожу:

                        ...Считается, что для идентификации гласной достаточно двух первых формант, поэтому гласные часто изображают на плоскости F1,F2, где они образуют вытянутый треугольник. Возможно, третья форманта является дополнительным, избыточным признаком гласной. Некоторым подтверждением этой точки зрения является факт, что человек может научиться читать "видимую речь" (спектр в координатах ВРЕМЯ-ЧАСТОТА, где максимумы амплитуды спектра отображаются почернением или пиками для трехмерных изображений). Заранее отметим, что это умение никак не отразилось на создании систем автоматического распознавания речи. Либо виртуозы чтения не могут вербализовать правила, которыми они пользуются при чтении, то есть используются столь же мало познанные процессы зрительного восприятия, либо ошибки распознавания по видимой речи больше, чем в системах автоматического распознавания (уровень ошибок распознавания по видимой речи, насколько мне известно, никто не измерял)...

                        Может быть, кто-нибудь сделает upgrade высказанных соображений?
                          Ну да, прикольно было бы научиться, вот тут:

                          http://home.cc.umanitoba.ca/~robh/

                          даже соревнования проводятся - каждый месяц вывешивают спектрограмму и по ней надо понять, что за звук. Я вот думаю - не заняться ли читерством - написать прогу которая по спектрограмме звук делает :)

                          Добавлено
                          iitta: кстати, там есть архив спектрограм, там везде объяснено, почему какая-то фонема выделена. Хотя это объяснения на объяснения Шерлока Холмса похожи, слишком вытянуты.

                          http://home.cc.umanitoba.ca/~robh/archive.html
                            nsh: спасибо. Как я понял, это интернациональная забава специалистов в области речи.
                              Нет ли случайно программы построения спектрограмм на Delphi?
                                Есть, но бяку лучше бросить :)

                                http://majority.wsnw.net/fft.zip
                                1 пользователей читают эту тему (1 гостей и 0 скрытых пользователей)
                                0 пользователей:


                                Рейтинг@Mail.ru
                                [ Script execution time: 0,1403 ]   [ 14 queries used ]   [ Generated: 5.07.25, 09:52 GMT ]