На главную Наши проекты:
Журнал   ·   Discuz!ML   ·   Wiki   ·   DRKB   ·   Помощь проекту
ПРАВИЛА FAQ Помощь Участники Календарь Избранное RSS
msm.ru
Модераторы: RaD, nsh
Страницы: (12) [1] 2 3 ...  11 12 все  ( Перейти к последнему сообщению )  
> Обмен книгами по распознаванию речи
    Предлагаю меняться электронными книгами по распознаванию речи:
    Я сам отсканировал и теперь имею прекрасную книгу в pdf формате:
    1. D. G. Childers. Speech processing and synthesis toolboxes. John Wiley & Sons, 2000, 484 p.
    В ней изложение сопровождается программами, написанными в MatLab на двух дисках
    Цитата
    Description. Strike a balance between theory and practice! With this text, you'll, find a balance between theory and practice that allows you to build your understanding of the basic concepts, assumptions, and limitations of the theory of speech analysis and synthesis. The methods for data analysis as well as the theoretical background are provided to help you comprehend the analysis results. And you'll be able to study the features and properties of speech as a signal without having to record data and write software to analyses the data. The text includes two CDs that contain stand-alone and MATLAB software and speech and electroglottographic data.
    The CDs illustrate the effects that speech models and speech analysis procedures have on the quality of synthesized speech. An extensive speech database provides numerous speech files and other data. Examples included in each chapter demonstrate how to use the software.
    The CDs allow you to: 1)Calculate the parameters of linear prediction speech models. 2)Examine procedures for converting the speech of one speaker to sound like that of another speaker (i.e., voice conversion). 3)Analyse and alter the temporal structure of the speech signal. This allows you to automatically parse speech into various features, such as voiced segments, unvoiced segments, nasal and non-nasal segments, fricatives, stops, and more. 4)Create speech with a "high speaking rate" or generate speech with a "slow speaking rate." 5)Adjust the parameters of the vocal fold model to change the vocal fold tension, length, thickness, mass, etc., in order to observe the effects of these parameters on the vibratory motion of the vocal folds.
    Contents:1)Speech Analysis Toolbox; 2)Speech Production; 3) Labeling, and Characteristics; 4)Data and Measurements; 5)Linear Prediction; 6)Speech Synthesis and a Formant Speech Synthesis Toolbox; 7)Voices - A Voice Conversion Toolbox; 8)Time Modification of Speech Toolbox; 9)Animated Vocal Fold Model Toolbox; 9)Articulatory Speech Synthesis Toolbox.

    сама книга-364 MB, CD-1- 592 MB, CD-2- 230 MB
    2. Винцюк Т. К.: "Распознавание слов устной речи методами динамического программирования"
    177 MB
    2.М.А Сапожков: "Речевой сигнал в кибернетике и связи"
    128 MB
    Их можно переделать в формат DjVu – книги займут на порядок меньше места. Я скачал кодер с сайта http://www.djvuzone.org/. Теперь к нему нужен крек. Слышал, что есть бесплатные кодеры.

    Мне нужны книги
    Рылов "Анализ речи в распознающих системах", Минск, 2003г,
    Тим Кинтцель "Программирование звука на ПК"
    Лобанов Б.М. Анализ и синтез речи. Сборник научных трудов /АН БССР Институт технической кибернетики. Науч. Ред. Лобанов Б.М. Минск, 1991, -86 с. (621.391.8 : 621.395)
    Р. Петелин, Ю. Петелин, Музыкальный компьютер. Секреты мастерства
    О. Гордеев, Программирование звука в Windows. Руководство для профессионалов
    также
    Sound Forge последний и литература по нему. Там вроде есть нормировка по времени.
    Алгоритмы по разложению сигналов в виде суммы затухающих или нарастающих синусоид, частоты которых вычисляются по формулам Прони.

    Я свои книги кладу на ftp. Ограничений по размеру, трафику и времени у меня практически нет. При обмене сообщаю пароли на ftp.
    PS. Могу менять TIMIT базу – это целый диск. Есть прога, которую сам написал в матлабе. Она бьет всю TIMIT базу или ее отдельные диалекты на фонемы. Можно дополнительно указывать, в какие каталоги их собирать, например, в отдельные каталоги файлы сонорных, шипящих, фрикативных и т.д.
    Ее конечно надо доработать, например, считать среднюю длину фонем и строить гистограммы. Счас у меня простая нормировка по амплитуде к максимальному уровню для 16 битов. Есть какая-то RMS нормализация очень модная у обработчиков музыкальных звуков
    RMS нормализация
    Сообщение отредактировано: grisania -
      Есть бумажные ксерокопии:

      Лобанов Б.М. Анализ и синтез речи. Сборник научных трудов /АН БССР Институт технической кибернетики. Науч. Ред. Лобанов Б.М. Минск, 1991, -86 с. (621.391.8 : 621.395)

      Р.К. Потапова - Речевое управление роботом Москва "Радио и связь" 1989

      У. Ли - Методы автоматического распознавания речи Под ред. У. Ли - Москва "Мир" 1983 первый том

      Нужен TIMIT
      Сообщение отредактировано: DimmK -
        Закачал
        Лобанов Б.М. Анализ и синтез речи. Сборник научных трудов /АН БССР Институт технической кибернетики. Науч. Ред. Лобанов Б.М. Минск, 1991, -86 с. (621.391.8 : 621.395)
        http://rapidshare.de/files/24195700/lobanov2.djvu.html
          Цитата DimmK @
          Закачал
          Лобанов Б.М. Анализ и синтез речи. Сборник научных трудов /АН БССР Институт технической кибернетики. Науч. Ред. Лобанов Б.М. Минск, 1991, -86 с. (621.391.8 : 621.395)
          http://rapidshare.de/files/24195700/lobanov2.djvu.html

          Я сегодня закачаю в ftp TIMIT базу и сообщу тебе адрес и пароль по приватному сообщению.

          А эти книжки интересные или нет
          Р.К. Потапова - Речевое управление роботом Москва "Радио и связь" 1989
          У. Ли - Методы автоматического распознавания речи Под ред. У. Ли - Москва "Мир" 1983 первый том

          Спасибо за ссылку на механический осциллятор. Я вроде понял, что как человек принимает речь через своии 30000 осцилляторы.
            Цитата grisania @
            Тим Кинтцель "Программирование звука на ПК"

            А что именно тебе надо из этой книжки? Книги у меня нет, но алгоритмы захвата и воспроизведения звука я отработал на Win98 ещё в прошлом веке :)
              Цитата RaD @
              А что именно тебе надо из этой книжки? Книги у меня нет, но алгоритмы захвата и воспроизведения звука я отработал на Win98 ещё в прошлом веке

              Меня интересует DC offset - вычитание среднего и нормировка уровня RMS. Мне интересно, что он пишет на эту тему. Так как RMS - это тоже самое, когда я загоняю все фонемы перед распознванием на единичную сферу. Оказывается во всех музыкальных прогах (Sound Forge и т.д.) есть такая процедура.
                Все что есть - оцифрую и скину.

                Ищу книжки
                4. Винцюк Т.К. Анализ, распознавание и интерпретация речевых сигналов. Киев: Наукова Думка, 1987.

                5. Винцюк Т.К. Организация вычислений при распознавании больших словарей // Автоматическое распознавание и синтез речевых сигналов: Сб. науч. тр. Киев, 1989.

                6. Винцюк Т.К. Сравнение ИКДП- и НММ - методов распознавания речи // Методы и средства информ. речи. Киев, 1991.

                Добавлено
                Метод Прони здесь:
                Главы из книги Марпла-мл. “Цифровой спектральный анализ и его приложения”
                http://athena.vvsu.ru/carina/dsp/link.html
                  Цитата DimmK @
                  Ищу книжки
                  4. Винцюк Т.К. Анализ, распознавание и интерпретация речевых сигналов. Киев: Наукова Думка, 1987.

                  Эту я положу, где будет TIMIT. Сам сканировал
                    Цитата grisania @
                    Цитата DimmK @
                    Ищу книжки
                    4. Винцюк Т.К. Анализ, распознавание и интерпретация речевых сигналов. Киев: Наукова Думка, 1987.

                    Эту я положу, где будет TIMIT. Сам сканировал

                    Вы в привате получали сообщение?
                    Я ответа пока не получил.
                      Цитата

                      .К. Потапова - Речевое управление роботом Москва "Радио и связь" 1989

                      не советую. Автор в теме распознавания разбирается посредственно. В теме управления роботами тоже. Хороший обзор там есть и все. И еще много лингвистических соображений.

                      очень Винцюка хочется. все, что есть
                      есть:

                      Тим Кинтцель "Программирование звука на ПК", бумажный, говорите, если надо - буду сканировать
                      Жигулевцев и др. "Речевой диалог в системах управления", тоже бумажный

                      Добавлено
                      ах,да, еще есть невероятное количество трудов АРСО - конференция была такая в советское время "Автоматическое распознавание слуховых образов", годы эдак с 82 по 91. Тоже, увы, бумажные
                        У меня есть следующие книги:

                        В бумажном виде (готов отсканировать нужное):
                        Тим Кинтцель "Программирование звука на ПК"
                        Р. Петелин, Ю. Петелин, Музыкальный компьютер. Секреты мастерства
                        О. Гордеев, Программирование звука в Windows. Руководство для профессионалов
                        также
                        Sound Forge. Музыкальные композиции и эффекты. Скотт. Гарригус.

                        В электронном:

                        Mark Tatham, Katherine Morton "Developments in Speech Synthesis" John Wiley Sons
                        Alan W Black, Kevin A Lenzo: Building Synthetic Voices
                        Кейтер_Компьютеры-синтезаторы речи
                        Chistovich, Vencov, Granstrem, i dr. Fiziologija rechi. Vosprijatie rechi chelovekom Nauka, 1976
                        Маркел_Линейное предсказание речи
                        Оппенгейм_применение ЦОС
                        Сапожников Михайлов Вокодерная связь
                        Рабинер_Шафер_Цифровая обработка речевых сигналов
                        И много известных советских книг.


                        Меня интересуют книги в которых описывается синтез речи, его реализация желательно на ПК. На высоком уровне. У кого-нибудь есть такие?
                        А также книги ищу (ещё не нашёл):

                        digital speech Kondoz
                        improvements in speech synthesis Keller, Bailly, ...
                        mathematical models for speech technology Stephen Levinson
                        speech coding algorithms Wai C Chu


                        PS Что то из инета качал в результате очень долгих поисков, но адресов не помню, поэтому в соседней теме написать немогу.
                        Сообщение отредактировано: Lebedev -
                          Нашел хороший сайт
                          http://physicsbooks.narod.ru/
                          где лежат:
                          "Комиссары Интернета" (doc zip 17 кб)
                          Программа для просмотра, редактирования и создания файлов формата djvu. Программа не требует установки, скачайте, распакуйте и запустите из папки"Bin" файл DjVuPro.exe и всё, программа должна работать.

                          Программа для просмотра, редактирования и создания файлов формата djvu (zip 2.45 мb)

                          Программа для распаковки и создания архивных файлов большинства известных форматов. Для установки программы, после распаковки архивного файла "WinRAR_3_20.zip", запустите из папки"WinRAR 3.20 RU" файл wrar320ru.exe, для взлома установленной программы прилагается Keygen.exe в папке "Crack".

                          Программа WinRAR 3.20 RU для распаковки архивных файлов(zip 1,00 мb)

                          Программа для работы с файлами по FTP v 7.1, patch прилагается. Скачайте, распакуйте и установите программу из папки cuteftp, эта программа корректно работает с протоколом FTP, позволяя скачивать и закачивать файлы на FTP-сервер (проверено на сервере "Народ'а" и других.
                          многотомный архив
                          первый файл архива (zip 5,00 мb)
                          второй файл архива (zip 1,04 мb)

                          Программа Сканкромсатор для обработки отсканированного материала. Программа умеет разделять отсканированный разворот на отдельные страницы, убирать тёмную полосу в середине разворота, выравнивать страницы, и многое другое. Скачайте, распакуйте и запустите программу (она не требует установки).

                          Программа "Сканкромсатор версия 5.6а_full"(rar 2,26 мb)

                          Сайт автора программы
                            Ищу книжки
                            Плотников В.Н., Белинский А.В., Суханов В.А., Жигулевцев Ю.Н. Цифровые анализаторы спектра. – М.: Радио и связь, 1990.

                            Макс Ж. Методы и техника обработки сигналов при физических измерениях. В 2-х т.т. Пер. с англ. – М.

                            Дворянкин С.В. Компьютерные технологии защиты речевых сообщений в каналах электросвязи /Под ред. А.В. Петракова. – М.:РИО МТУСИ, 1999.

                            Cорокин В.Н. Синтез речи. М.: Наука, 1992

                            Могу предложить
                            Спектры и анализ А.А.Харкевич
                            АННОТАЦИЯ Монография посвящена раэбору спектральных представлений, применяемых в теории колебаний, акустике и радиотехнике, и обсуждению методов спектрального анализа.
                            Оглвавление: http://vova1001.narod.ru/00001729.htm
                            Винцюк Т.К. Анализ, распознавание и интерпретация речевых сигналов. Киев: Наукова Думка, 1987. djvu
                            Сообщение отредактировано: grisania -
                              Ищу книжку
                              Информационные технологии и вычислительные системы. 2004-Вып. 2.
                              Содержание
                              В.Л.Арлазаров
                              Современный инструментарий для разработки речевых технологий
                              Д.С.Богданов, О.Ф.Кривнова, А.Я.Подрабинович
                              Структура проблемы автоматического распознавания речи
                              В.Н.Сорокин
                              Современные проблемы в области распознавания речи
                              В.И.Галунов, А.Н.Соловьев
                              Инвариантность методов распознавания речи
                              В.Я.Чучупал
                              Математическая модель произнесения команд на основе монотонных вероятностных автоматов
                              Д.Н.Бабин, И.Л.Мазуренко
                              http://www.edurss.ru/cgi-bin/db.pl?cp=&page=Book&id=24134&lang=Ru&blang=ru&list=52
                                Ура, получил на время книгу:
                                L. Rabiner, B. Jang
                                Funfamentals of speech recognition, 1993
                                Тут классно описаны:
                                MFFC, HMM, DTW, Time aligmentand and Normalization, про фонемы.
                                Одно четко понял - надо читать класиков, они понимают свой предмет.
                                0 пользователей читают эту тему (0 гостей и 0 скрытых пользователей)
                                0 пользователей:
                                Страницы: (12) [1] 2 3 ...  11 12 все


                                Рейтинг@Mail.ru
                                [ Script execution time: 0,0400 ]   [ 15 queries used ]   [ Generated: 28.03.24, 12:08 GMT ]