На главную Наши проекты:
Журнал   ·   Discuz!ML   ·   Wiki   ·   DRKB   ·   Помощь проекту
ПРАВИЛА FAQ Помощь Участники Календарь Избранное RSS
msm.ru
Модераторы: RaD, nsh
Страницы: (7) « Первая ... 5 6 [7]  все  ( Перейти к последнему сообщению )  
> Алгоритм распознавания речи , выбор алгоритма
    zamir
    Ага, спасибо. Понял.
      А я мучаю метод Roman55555.Многие слова распознаёт на ура!
      Но становится вопрос о транскрипции в его архиве есть "перевод" русских букв на англйские фонемы.
      Вопрос.Что значат вот эти символы?В xml не знаю в каком порядке должны идти...
      ExpandedWrap disabled
        -   syllable boundary (hyphen)  1
        !   Sentence terminator (exclamation mark)  2
        &   word boundary   3
        ,   Sentence terminator (comma) 4
        .   Sentence terminator (period)    5
        ?   Sentence terminator (question mark) 6
        _   Silence (underscore)    7
        1   Primary stress  8
        2   Secondary stress    9
        _ вроде как тишина написано
        1 первичное ударение
        2 вторичное ударение
        & гранца слова
        остальное вроде как знаки припенания
          Спасибо,в принципе как и предпологал.
          Но как это правильно использовать в правилах grammar в xml?
          И зачем знаки припенания,если в правилах настраивается только для одного слова?Или они уже для движка TTS?
            Не знаю :)
            Я использую sphinx.
            Вместо XML языковую модель в sphinx указывается в JSGF (по идеи смысловая нагрузка таже самая)
            вот пример моего файла

            Цитата
            #JSGF V1.0;

            grammar camera;

            public <camera> = ( <doo1> | <doo2> | <do3> );
            <doo1> = <do1> ( <cam1> <prenum> <num1> | <num2> <cam1> );
            <doo2> = <do2> ( <cam2> <prenum> <num1> | <num3> <cam2> | <allcam> );
            <do1> = ( включить | подключить | выключить | отключить | опросить );
            <do2> = ( опросить | опросить состояние | состояние | статус | описание );
            <do3> = ( пока | пока пока | досвидание | положить трубку );
            <cam1> = ( камеру | видео-камеру );
            <cam2> = ( камеры | видео-камеры );
            <allcam> = ( всех камер | всех видео-камер | каждой <cam2> );
            <prenum> = [ номер ];
            <num1> = ( один | два | три | четыре | пять | шесть | семь | восемь | девять );
            <num2> = ( первую | вторую | третью | четвёртую | пятую | шестую | седьмую | восьмую | девятую );
            <num3> = ( первой | второй | третьей | четвёртой | пятой | шестой | седьмой | восьмой | девятой );


            для сравнения JSGF и XML

            grammar.xml

            ExpandedWrap disabled
              <?xml version="1.0"?>
              <grammar xmlns="http://www.w3.org/2001/06/grammar" xml:lang="en-US" version="1.0" mode="voice" root="digit">
                <rule id="digit">
                  <one-of>
                    <item>one</item>
                    <item>two</item>
                    <item>three</item>
                  </one-of>
                </rule>
              </grammar>


            grammar.jsgf

            ExpandedWrap disabled
              #JSGF V1.0;
              grammar digits;
              public <numbers> = (one | two | three);
              Ребята, вопрос.
              Есть куча надиктованных mp3-файлов и набранные с них тексты.
              Можно ли их использовать для обучения системы распознаванию?
                да. я так и делаю.
                буду рад, если вы поделитесь своими файлами.
                  я вам в личку мой имейл бросил, можете ответить?
                    Roman55555 Как работает код на C# c английскими фонемами? Я написал программу по распознаванию русской речи с библиотекой sphinx. Единственная проблема это пополнение базы словаря. Хотелось чтобы можно было делать это автоматом, т.е. имеется слово в единственном или множественном числе, далее создается морфема слова автоматом.
                    0 пользователей читают эту тему (0 гостей и 0 скрытых пользователей)
                    0 пользователей:


                    Рейтинг@Mail.ru
                    [ Script execution time: 0,0295 ]   [ 16 queries used ]   [ Generated: 28.03.24, 23:34 GMT ]