На главную Наши проекты:
Журнал   ·   Discuz!ML   ·   Wiki   ·   DRKB   ·   Помощь проекту
ПРАВИЛА FAQ Помощь Участники Календарь Избранное RSS
msm.ru
Модераторы: RaD, nsh
  
> Pocketsphinx для распознавания БД из небольших текстов
    Здравствуйте, уважаемые корифеи речевых технологий! :thanks:

    У меня дилетантский вопрос после нескольких дней погружения в технологии распознавания речи.

    Скажите, пожалуйста, есть вообще смысл браться за задачу:
    есть БД из текстов (конечное число: 30-50), примерного размера 100 слов, язык - русский;
    ребенок читает один из текстов;
    необходимо распознавать без интернета все прочитанные слова и подсвечивать цветом уже прочитанные;
    в конце посчитать количество прочитанных за минуту слов вместе с предлогами;


    Имеется ограничение на размер акустической модели и словаря (< 40 Mb).
    Прочитав про распознавание речи, я выбрала pocketsphinx, как наиболее подходящий. Пишу под андроид.
    Но у меня возникли проблемы с точностью распознавания, если даже я имею точный словарь из слов из текста,
    всё равно большой процент ошибок.
    Умные люди посоветовали обучить свою акустическую модель. Но у меня закралось сомнение, насколько
    оправданы будут мои труды, может быть, это вообще не выполнимая пока задача. Тут следует учесть,
    что читать будет ребенок, и тут возможны варианты, что по слогам :facepalm: .


    Спасибо большое за любые ответы!
    (Поискала по форуму и не смогла найти, где прибиться, не хочется в чужие темы влезать. Так что, извините, что создала новую).
    Сообщение отредактировано: Daria -
      Добрый день!

      mdef можно упаковать и выиграть несколько мегабайт.
      Но с учётом того что вас будет распознаваться детский голос, я попрежнему рекомендую смотреть в сторону сборки новой модели.
        Спасибо, Замир!
        А скажите, пожалуйста, сборка новой модели - это нужно свою нейронную сеть писать, или есть уже готовые механизмы?
        Если возможно, киньте, пожалуйста, в меня ссылочками, где про это почитать, а то я только научные статьи про
        скрытые марковские модели нашла.
          Тренировка детской модели занимает от 6 месяцев из-за трудностей сбора и обработки данных. Документация по тренировке модели тут

          http://cmusphinx.sourceforge.net/wiki/tutorialam

          Также лучше прочесть и другие главы руководства.
            Спасибо, Николай :) ;) .
            0 пользователей читают эту тему (0 гостей и 0 скрытых пользователей)
            0 пользователей:


            Рейтинг@Mail.ru
            [ Script execution time: 0,0319 ]   [ 15 queries used ]   [ Generated: 28.03.24, 08:19 GMT ]