На главную Наши проекты:
Журнал   ·   Discuz!ML   ·   Wiki   ·   DRKB   ·   Помощь проекту
ПРАВИЛА FAQ Помощь Участники Календарь Избранное RSS
msm.ru
Модераторы: RaD, nsh
Страницы: (15) « Первая ... 10 11 [12] 13 14 ... Последняя » все  ( Перейти к последнему сообщению )  
> Фонемное распознавание речи
    Всем привет.

    Нет ли случайно у кого-нибудь MFCC на Delphi? Да в принципе и на С пойдет :-)
      china_630
      HTK вам в помощь. Линуховый вариант предоставляется в виде СИшных библиотек. Правда насчет коммерческого использования читайте условия.
        Кто знает, где достать программу пофонемной сегментации при помощи вейвлет-анализа? Подскажите, пожалуйста.
          Господа, подскажите, пожалуйста, методы (или ссылки на источники) для определения невокализованных участков. ЧОТ использовать не хочу.
            Цитата sergun83 @
            методы для определения невокализованных участков. ЧОТ использовать не хочу.

            Энергия вокализованных звуков речи лежит в основном в низкочастотной области.
            Возьмите отношение (или разницу) энергии в низкочастотной полосе и высокочастотной.
            Например 100-600гц. и 4000-5500гц.
              Цитата Анатоль @
              Цитата sergun83 @
              методы для определения невокализованных участков. ЧОТ использовать не хочу.

              Энергия вокализованных звуков речи лежит в основном в низкочастотной области.
              Возьмите отношение (или разницу) энергии в низкочастотной полосе и высокочастотной.
              Например 100-600гц. и 4000-5500гц.

              Спасибо за ответ, но энергия не подходит. Дело в том, что значения энергии для невокализованных звуков и значения энергии для тишины с шумом близки. А мне нужно отделить именно невокализованные звуки от тишины (шума).
              Сообщение отредактировано: sergun83 -
                Цитата sergun83 @
                Дело в том, что значения энергии для невокализованных звуков и значения энергии для тишины с шумом близки.

                Ну это не совсем так. Это справедливо для таких звуков, как "п" или "ф".
                А энергия таких звуков как "ш" или "ч" очень большая. Да и других вполне заметна.
                Но если шумы большие, то слабых шумных звуков Вы просто никак не обнаружите.
                Ну разве что спект шумов Вам известен, или по динамике формант гласных можно определить прилегающие согласные.
                  Кстати интересная задачка - шум превышает по амплитуде в несколько раз звук "Ш".
                  Чего делать будем ?
                    Цитата shur_nn @
                    Кстати интересная задачка - шум превышает по амплитуде в несколько раз звук "Ш".
                    Чего делать будем ?

                    Будем уши затыкать.
                      Я попробовал смешать "Ш" c белым шумом 1:10. Если слушать шум, а потом сумму, то "Ш"
                      прекрасно слышно и распознаваемо.
                        Цитата shur_nn @
                        Я попробовал смешать "Ш" c белым шумом 1:10. Если слушать шум, а потом сумму, то "Ш" прекрасно слышно и распознаваемо

                        Повторил Ваш эксперимент. Результат совсем противоположный.
                        Даже если смешать (добавить) к "ш" белый шум такой же амплитуды, то распознать там "ш" совершенно невозможно.
                        Тональные звуки можно услышать и распознать даже меньшей амплитуды, чем шум, а вот "ш" не получилось.
                        Может Вы реагировали на изменение амплитуды шума и воспринимали это как наличие там "ш"?
                          Я думаю, что Вы производили измерения по абсолютной величине, а не относительной.
                          Я повторяю, сравните белый шум и белый шум+"Ш" в соотношении 10:1 (один за другим,
                          интервал между звуками не более 0.5 сек.). Я это делал.
                          Мое субъективное мнение, что относительно белого шума, звук "Ш" в белом шуме распознаваем
                          довольно отчетливо. Хочу заметить, что мы с Вами наверняка не одинаковы в плане восприятия звуков.
                          Я прослушивал звуки через наушники гарнитуры. Возможно Вы прослушивали
                          их через акустику в условиях зашумленного помешения, или уровень
                          звукового давление был недостаточный. Я провел довольно много времени за этим занятием.
                          Конечно я допускаю мысль, что моя слуховая система адаптировалась.
                          Я это слышу, значит распознавание шипящих на фоне белого шума возможно.
                          Правда не уверен, что оно возможно с использованием спектрального анализа.
                            Статью интересную по сегментации нашел.
                            http://www.contrterror.tsure.ru/site/magazine12/07-16-Fedorov.htm
                              Цитата shur_nn @
                              Статью интересную по сегментации нашел.

                              Да, весёлая статья. В начале 91% точность сегментации. Потом ни одного упоминания этого числа нет. Зато точность в выводах значится уже 85%, а затем 75%. Исследования проводились на отдельных словах, а не на слитной речи. Алфавит - 36 фонем. Интересно каких? Ощущение, что не было мягких. Возможно, не было некоторых классов безударных. 10 дикторов - не указано количество мужчин и женщин и, конечно, не указана точность сегментации для каждого пола. Все рисунки разные - нет двух одинаковых сигналов, на одном из которых была бы ручная, а на другом автоматическая сегментация. Похоже, рисунки были приведены не для сравнения ручной и автоматической сегментации. Что означает "точность" при результате 85% непонятно. При 75% - понятно (расхождение менее 15 мс). В первом варианте считалось правильным, если граница определена до середины фонемы или вообще попала на фонему? Слишком много непонятностей, недосказанностей, поэтому не стал бы доверять и результату и алгоритму.
                                По многим замечаниям с Вами соглашусь. Однако этот вариант довольно интересен.
                                Ошибка предсказания неоспоримый факт смены направления движения процесса.
                                Возможно эта статья просто краткая информация о проделанной работе?
                                Не знаю, но на мой взгляд в этой статье задано правильное направление.
                                0 пользователей читают эту тему (0 гостей и 0 скрытых пользователей)
                                0 пользователей:


                                Рейтинг@Mail.ru
                                [ Script execution time: 0,0454 ]   [ 15 queries used ]   [ Generated: 8.09.24, 07:38 GMT ]