На главную Наши проекты:
Журнал   ·   Discuz!ML   ·   Wiki   ·   DRKB   ·   Помощь проекту
ПРАВИЛА FAQ Помощь Участники Календарь Избранное RSS
msm.ru
Модераторы: RaD, nsh
Страницы: (3) [1] 2 3  все  ( Перейти к последнему сообщению )  
> Варианты частотного анализа звуков
    Подскажите пожалуйста какие ещё варианты частотного анализа можно использовать кроме преобразование Фурье?
    Если может существуют не исключительно математические, может тогда принцип в общих чертах или алгоритм?
      Вейвлет преобразование

      https://habr.com/ru/post/449646/

      Разложение на компоненты с помощью сверточных нейросетей, тренируемых под задачу

      https://habr.com/ru/post/462527/
        Спасибо! Буду изучать!
          Еще преобразование Гильберта посмотрите
            Цитата olegfamus @
            какие ещё варианты частотного анализа можно использовать кроме преобразование Фурье?

            Набор резонансных фильтров может оказаться предпочтительнее. Вот тема на другом форуме, там с конца второй страницы обсуждаются преимущества резонаторов перед Фурье.
              Цитата Mikle @
              резонансных фильтров


              С моей точки зрения это тоже отличный вариант, я его тоже опробовал в нескольких вариациях анализов (хотя вариантов реализации допускаю огромное множество). Но у меня всякий раз возникает сомнения насколько качественно (вопрос соседней темы) выполнено преобразование, где критерий оценки, с чем сравнивать, как минимизировать количество переменных и итераций и тд
                Цитата olegfamus @
                возникает сомнения насколько качественно (вопрос соседней темы) выполнено преобразование, где критерий оценки, с чем сравнивать

                В той теме идёт сравнение с Фурье, есть исходники различных реализаций, есть замеры производительности.
                  Цитата Mikle @
                  В той теме идёт сравнение с Фурье


                  К сожалению вы наверно ошиблись со ссылкой... или я что то в теме пропустил. Хотя это вряд ли, поскольку тема называется Круговой визуализатор спектра.
                  Тема конечно интересная, с точки зрения образования. Возможно и практически найдётся большое количество мест применения, некоторые места вы и сами обозначили в теме. Но использовать получившиеся картинки как результат анализа... слишком много информации для человеческих глаз, так что этот результат для какого либо восприятия человеком необходимо (скорее всего математикой) ещё как минимум 1 раз проанализировать.(если конечно нелинейный квадратичный метод позволил акцентировать нужные компоненты).
                  зы: моё личное, возможно не квалифицированное мнение))
                  Сообщение отредактировано: olegfamus -
                    Цитата olegfamus @
                    или я что то в теме пропустил. Хотя это вряд ли, поскольку тема называется Круговой визуализатор спектра

                    В этом проекте изначально задействовано FFT, потом перешли на резонаторы, что позволило повысить точность, снизив число полос и нагрузку на ЦП. То есть задействован альтернативный метод частотного анализа. Визуализация уже потом, её можно откинуть.
                      Цитата Mikle @
                      потом перешли на резонаторы

                      Прошу прощения за мою невнимательность, вероятнее всего под резонаторами вы имели ввиду фильтры, о которых вы всё время ведёте разговор в той теме. Согласен что я лапух), читал текст без регистрации, во второй раз попался кусочек вашей программы (если не ошибаюсь на VB) и хотя я знаком только с Delphi всё же сумел понять что я был не прав.
                      … только что написал на страницу разной философии по поводу той темы и всё удалил) лучше попытаюсь задать несколько интересующих меня вопросов
                      VB не моя программа, можно мне ответить просто словами какова в том примере логика с фильтрами (или если просто алгоритм работы с фильтрами до момента визуализации результатов)? как вы оценивали насколько самодостаточны для решения поставленной задачи результаты разложения спектра? как вы их оценивали? сравнивали как при переходе с преобразования фурье изменилась производительность компьютера? или может зрительным восприятием по степени изменения цветовой схемы диаграмм?
                      Я понимаю, что в той теме преследовались какие то конкретные цели, но наверно я их не понял, вернее нет дополнительных знаний чтобы их понять) Насколько я понимаю вы хорошо владеете и delphi и если вам сложно описать алгоритм исследований, а у вас найдётся кусочек кода delphi именно как в вашем случае реализован частотный анализ, буду вам очень признателен.
                      Вообще меня интересуют все эти вопросы в части применения частотного анализа к вопросам распознавание речи и возможности применения этого анализа в устройствах искусственного интеллекта.
                      Сообщение отредактировано: olegfamus -
                        Цитата olegfamus @
                        вероятнее всего под резонаторами вы имели ввиду фильтры, о которых
                        Ну, вообще-то, резонатор это и есть фильтр, причём, как правило, с очень высокой добротностью.
                          Цитата amk @
                          Ну, вообще-то, резонатор это и есть фильтр, причём, как правило, с очень высокой добротностью.

                          Если я правильно всё понимаю (вернее мы все сейчас говорим на одном языке) всё это аналитические методы!?)
                          что касается добротности - и микроскопом можно гвозди забивать, только нужен определённый способ чтобы не испортить его. Определяющее в этом предложении СПОСОБ, он то мне и интересен (ну и добротность естественно)-шутка).
                          Сообщение отредактировано: olegfamus -
                            Цитата olegfamus @
                            всё это аналитические методы!?

                            Это численный метод последовательного расчёта спектра сэмпл за сэмплом.
                            Цитата olegfamus @
                            что касается добротности - и микроскопом можно гвозди забивать

                            Метод эмулирует работу N колебательных контуров (в конкретном примере N = 481, от 0 до 480). Частоты контуров распределены по логарифмической шкале. Добротность контура - очень важная величина, она определяет ширину полосы пропускания фильтра так, чтобы фильтры пересекались на уровне 0.5.
                            Структура Private Type tRes определяет параметры одного конкретного фильтра, создаётся массив из 481 элемента типа такой структуры и в процедуре ResInit(), которая вызывается однократно в начале, рассчитываются параметры всех фильтров.
                            Поля структуры:
                            ExpandedWrap disabled
                                u, i   - напряжение и ток в контуре.
                                p      - квадрат энергии в контуре.
                                k1, k2 - задают добротность контура.
                                ku, ki - задают частоту колебаний контура.

                            После инициализации массива вызываем с частотой 44100 Гц процедуру Tick() и функцию ResVal().
                            В Tick() перерассчитываются "u, i", а в ResVal() энергия.
                            Эти строки имитируют простейший фильтр частот, ниже рабочего диапазона, в т. ч. постоянной составляющей:
                            ExpandedWrap disabled
                                VV = VV * 0.9995 + v * 0.0005
                                v = v - VV

                            ResVal() можно вызывать с меньшей частотой, тогда нужно изменить пару констант в самой функции, в той теме я это описывал.
                              Цитата Mikle @
                              Метод эмулирует работу N колебательных контуров

                              Спасибо! всё стало понятно, как только я увидел такие параметры как ток и напряжение. Колебательный контур и все вытекающие из него формулы. Конечно я ошибся что я тоже использовал уже такой метод. Вся вселенная состоит из колебательных процессов.)
                              Мне очень интересно какие результаты могли бы получиться при помощи ваших методов основанных на математике колебательных контуров в рамках моей задачи (анализ речи). Конечно я и сам могу попробовать написать такой код, но очень сомневаюсь что это получиться достаточно быстро, потому как каждый метод содержит нюансы, дойти до которых иногда бывает очень не просто, особенно когда при решении той или иной задачи большое количество параметров назначается чисто интуитивно: частота дискретизации, разрядность значений, количество полос - это общие, ширина полосы пропускания, добротность контура и тд в вашем методе. Это всё огромное человеко-дни или месяца.... но для этого и существует форум, чтобы помочь.
                              Скажите, а вам приходилось заниматься вопросами анализа речи? Приходилось ли использовать ваш вышеуказанный метод для такого анализа? И если приходилось, то каким методом вы пользовались (или можно использовать) чтобы свернуть частотные данные в сигнал, чтобы хотя бы на слух определить его качество по сравнению с оригиналом?
                                Цитата olegfamus @
                                какие результаты могли бы получиться при помощи ваших методов основанных на математике колебательных контуров в рамках моей задачи (анализ речи)

                                В первом сообщении ничего про речь конкретно сказано не было, просто "частотный анализ". Но, в принципе, какая разница? Речь - это тоже звук, исходя из этого можно сузить исследуемый диапазон частот где-то до 80-8000.
                                Цитата olegfamus @
                                частота дискретизации, разрядность значений, количество полос

                                Частота, очевидно, та, которая задействована в исследуемом сигнале, там выбрано 44100, как типичное значение для 99.9% mp3.
                                Разрядность влияет только на качество.
                                Количество полос зависит от целей, там было целью исследование нот, поэтому выбрано было по 4 полосы на полтона.
                                Какой именно анализ речи? От этого зависит и кол-во полос.
                                Цитата olegfamus @
                                свернуть частотные данные в сигнал

                                То есть цель - разобрать звук по частотам, а потом из этих данных восстановить звук? А смысл? Сжатие? Тогда можно почитать про кодирование в mp3, там много общего.
                                0 пользователей читают эту тему (0 гостей и 0 скрытых пользователей)
                                0 пользователей:
                                Страницы: (3) [1] 2 3  все


                                Рейтинг@Mail.ru
                                [ Script execution time: 0,0408 ]   [ 15 queries used ]   [ Generated: 16.04.24, 10:43 GMT ]