На главную Наши проекты:
Журнал   ·   Discuz!ML   ·   Wiki   ·   DRKB   ·   Помощь проекту
ПРАВИЛА FAQ Помощь Участники Календарь Избранное RSS
msm.ru
Модераторы: RaD, nsh
  
> FAQ , Часто Задаваемые Вопросы
    Этим хочу положить начало системному изложению содержания этого раздела, буду рад дополнить его новыми вопросами и ответами. Желательно попытаться сделать предложенный набор полным и, в то же время, минимальным.

    Общие вопросы

    Какие ресурсы в сети посвящены речевым технологиям

    Журнал Речевые Технологии

    Какие базовые знания нужны для того, чтобы вести разработку

    Необходимо владеть программированием, что включает в себя не только знание основных языков, но и владение процессом разработки ПО. Очень желательно знание английского языка.

    Какую литературу небходимо изучить

    Обзор Рабинера по HMM

    Скрытые марковские модели и их применение в избранных приложениях при распознавании речи

    Где найти дополнительную литературу

    Достаточно большой список полезных книг http://dsp-book.narod.ru

    Программы для работы с речью

    В какой программе можно изучить спектр, посмотреть форманты, частоту основного тона

    Praat - уникальная программа для работы с речью, разметки,
    редактирования, исследований

    Praat слишком сложен, есть ли что-нибудь пропроще

    Wavesurfer - удобное простое приложение.

    Какие инструменты для разработки речевых приложений используются

    HTK - Hidden Markov Model Toolkit

    Какие библиотеки позволяют создавать приложения, распознающие речь

    http://cmusphinx.sourceforge.net/ - CMUSphinx, библиотека для распознавания речи на C и Java, поддерживает встраиваемые устройства

    http://julius.sourceforge.jp/en_index.php?q=index-en.html - библиотека для распознавания речи на C, поддерживает модели HTK

    Индустриальные стандарты

    Какие индустриальные стандарты разаработаны и применяются в области речевых технологий

    Для IVR систем активно используются стандраты W3C, такие как VoiceXML, SSML http://www.w3.org/Voice/

    Какие программные интерфейсы к системам распознавания используются

    В среде Windows используется Microsoft SAPI

    Особенности русского языка

    Чем русский язык отличается от других хорошо разработанных языков (например, английского).

    Существенного различия между приложениями для русского и других языков нет. Все они строятся по единой схеме.
    Основные отличия русского языка следующие:
    • Фонетический состав языка, как и для любого другого языка этот состав описывается набором аллофонов, базой звуков, акустической моделью.
    • Лингвистическая структура языка, обладающего изменяющейся морфологией и нечётким порядком слов. В связи с этим лингвистические модели русского языка отличаются от, например, английских. Для моделирования русского применяются морфологические модели или модели из менее крупных элементов - подслов.

    Где можно найти описания специфики русского языка

    С кратким изложением фонетики русского языка можно ознакомиться в Википедии. Полное изложение доступно в различных учебниках, например

    Бондарко Л. В. Фонетика современного русского языка. СПб., 1998.

    Моделирование ударений, анализ морфологии, модели языка и их применения, к сожалению, мало исследованы. Описания
    текущих достижений можно найти в различных научных работах.

    Записи речи

    Где найти записи отдельных звуков

    Нигде, отдельных звуков в речи нет. Речь - динамический процесс где звуки перемешиваются, взаимодействуют
    друг с другом. Записи обычно содержат речевые отрезки, куски речи между паузами.

    Где скачать образцы речи, в том числе русской

    VoxForge - база речи

    Сообщения были разделены в тему "Можно ли изменить интонацию в Festival"
    0 пользователей читают эту тему (0 гостей и 0 скрытых пользователей)
    0 пользователей:


    Рейтинг@Mail.ru
    [ Script execution time: 0,0140 ]   [ 15 queries used ]   [ Generated: 15.07.24, 23:56 GMT ]