Сжатие/растяжение звука -> Форум на Исходниках.Ру

	Наши проекты: Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту

Здравствуйте, Гость ! [216.73.217.4]

правила раздела Алгоритмы

1. Помните, что название темы должно хоть как-то отражать ее содержимое (не создавайте темы с заголовком ПОМОГИТЕ, HELP и т.д.). Злоупотребление заглавными буквами в заголовках тем ЗАПРЕЩЕНО.
2. При создании темы постарайтесь, как можно более точно описать проблему, а не ограничиваться общими понятиями и определениями.
3. Приводимые фрагменты исходного кода старайтесь выделять тегами code.../code
4. Помните, чем подробнее Вы опишете свою проблему, тем быстрее получите вразумительный совет
5. Запрещено поднимать неактуальные темы (ПРИМЕР: запрещено отвечать на вопрос из серии "срочно надо", заданный в 2003 году)
6. И не забывайте о кнопочках TRANSLIT и РУССКАЯ КЛАВИАТУРА, если не можете писать в русской раскладке

Модераторы: Akina, shadeofgray

Новое голосование

Сжатие/растяжение звука

Joss	Сообщ. #1 , 09.04.07, 18:25
Newbie Профиль · PM Рейтинг (т): 0	Поскажите алгоритм временного сжатия/растяжения сигнала(звука). Зараннее благодарен

ors_archangel	Сообщ. #2 , 09.04.07, 19:10
Senior Member Профиль · PM	Линейное интерполирование! - быстро и сердито!

Joss	Сообщ. #3 , 10.04.07, 05:02
Newbie Профиль · PM Рейтинг (т): 0	А в случае сжатия просто выбрасывать часть отсчетов?

R-2	Сообщ. #4 , 10.04.07, 08:20
Senior Member Профиль · PM Рейтинг (т): 7	Цитата Joss @ 10.04.07, 05:02 А в случае сжатия просто выбрасывать часть отсчетов? Вообще не знаю, но точно могу сказать, что если будешь выбрасывать то не избежать потери качества звука...

C300G	Сообщ. #5 , 10.04.07, 08:31
Profi Профиль · PM Рейтинг (т): 104	Цитата Joss @ 10.04.07, 05:02 А в случае сжатия просто выбрасывать часть отсчетов? Лучше уж как-то усреднять сжимаемые фрагменты

Joss	Сообщ. #6 , 10.04.07, 11:59
Newbie Профиль · PM Рейтинг (т): 0	При таком подходе изменяется тональность звука, т.е. при растяжении голос становится более низким, при сжатии - высоким. Как избавиться от этого эффекта?

shadeofgray

Сообщ. #7 , 10.04.07, 12:55

Moderator

Профиль · PM

Рейтинг (т): 30

Я краем уха слышал, что помогает делать преобразование Фурье, и затем на его основе генерировать сигнал с тем же набором частот, но бОльшей длительности. Сам я этим никогда не занимался, но могу предположить, что процесс состоит из следующих частей:

1. поделить сигнал на маленькие блоки
2. сделать Фурье каждого блока
3. сгенерировать на их основе сигнал бОльшей длительности, чем у оригинального блока
4. как-то "склеить" границы блоков, чтобы не было слышно щелчков. насколько я знаю, человеческий слух нечувствителен к фазе колебаний, только к частоте/амплитуде, так что можно попробовать двигать фазы для достижения эффекта...

всё это очень приблизительно, т.к. область не моя

Rikkie

Сообщ. #8 , 10.04.07, 13:10

Senior Member

Профиль · PM

Цитата Joss @ 10.04.07, 05:02

А в случае сжатия просто выбрасывать часть отсчетов?

Это же спектр только расширит.. Как раз вот это и получится:

Цитата Joss @ 10.04.07, 11:59

При таком подходе изменяется тональность звука, т.е. при растяжении голос становится более низким, при сжатии - высоким.

Подход shadeofgray здесь мне кажется более действенным.

Joss

Сообщ. #9 , 10.04.07, 17:42

Newbie

Профиль · PM

Рейтинг (т): 0

Цитата Rikkie @ 10.04.07, 13:10

Это же спектр только расширит..

Я, честно гогворя, и представлял себе растяжение/сжатие сигнала как сжатие/растяжение спектра. А результат не совсем такой...

Цитата shadeofgray @ 10.04.07, 12:55

3. сгенерировать на их основе сигнал бОльшей длительности, чем у оригинального блока

Будем получать периодическую последовательность отсчетов!

gena_dj	Сообщ. #10 , 11.04.07, 07:51
Unregistered	Цитата ors_archangel @ 09.04.07, 19:10 Линейное интерполирование! - быстро и сердито! Нельзя так просто. Нужно кроме собственно интерполяции произвести цифровую фильтрацию.

Joss	Сообщ. #11 , 11.04.07, 13:13
Newbie Профиль · PM Рейтинг (т): 0	Цитата gena_dj @ 11.04.07, 07:51 Нужно кроме собственно интерполяции произвести цифровую фильтрацию. А именно?

ors_archangel

Сообщ. #12 , 11.04.07, 15:01

Senior Member

Профиль · PM

Цитата gena_dj @ 11.04.07, 07:51

Нельзя так просто. Нужно кроме собственно интерполяции произвести цифровую фильтрацию.

В принципе, линейная интерполяция - вид цифровой фильтрации, но, может быть, gena_dj, ты имеешь в виду препроцессинг? Честно говоря, не представляю, что бы это могло быть.

neurofish

Сообщ. #13 , 11.04.07, 19:42

Member

Профиль · PM

Рейтинг (т): 3

странно, что вы задаете это вопрос в этом форуме, а не в "обработке звука" или "речевых технологиях"

итак, при увеличении/уменьшении скорости воспроизведения (что эквивалентно сжатию/растяжению) частоты также сдвигаются - становятся во столько раз ниже/выше во сколько раз изменили скорость. Тем не менее, мы наблюдаем, что многие медиаплейеры умеют ускорять/замедлять воспроизведение (в разумных пределах) так, чтобы голос и музыка не становились писклявыми или растянутыми. Такие медиаплейеры не просто изменяют скорость воспроизведения, они манипулируют с основным тоном сигнала. Идея (похожая на ту, что с БПФ была представлена выше) заключается в том, чтобы разбить сигнал на кусочки, где сигнал более-менее стационарен (не особенно меняется) и повторять эти кусочки (если нужно замедлить) или выбрасывать их (если нужно ускорить) добиваясь так сжатия/растяжения сигнала. Однако, грубое применение этого метода приведет к проблемам с основным тоном - ухо очень чувствительно к его изменению и если выбирать кусочки так, что туда будут попадать нецелые куски основного тона, это будет неприятно. Выход в том, чтобы выбирать кусками, например, периоды основного тона или использовать алгоритмы типа PSOLA

gena_dj

Сообщ. #14 , 12.04.07, 01:47

Unregistered

Цитата ors_archangel @ 11.04.07, 15:01

gena_dj, ты имеешь в виду препроцессинг

В принципе, да - ФНЧ высокого порядка такой, что после "растяжения" звукового фрагмента подавляются высокочастотные вомпоненты выше предельной частоты звукового. К примеру, пусть исходная частота дискретезации сигнала, к примеру, F_0=48000Гц. После "растяжения" мы получаем звуковой фрагмент с большей частотой дискретезации F_1>F_0, но воспроизводим на прежней частоте. Отсюда эффект "растяжения". Нужно отфильтровать частоты выше чем F_0^2/(2*F1).

"Сжатие" фрагмнта эквивалентно случаю F_1<F_0. Критерий фильтрации тот же. Здесь можно сначала применить up-sampling, потом фильтрацию, потом down-sampling до нужной частоты.

По поводу сжатия/растяжения без изменения основного тона. Здесь действительно используются повторы фрагментов. Выбирается частота повтора ~несколько десятков Гц. Для устранения разрывов на границах блоков используется частичное перекрытие блоков.

Joss	Сообщ. #15 , 14.04.07, 10:30
Newbie Профиль · PM Рейтинг (т): 0	Разобрался, спасибо всем за советы!

0 пользователей читают эту тему (0 гостей и 0 скрытых пользователей)

0 пользователей:

[ Script execution time: 0,0745 ] [ 15 queries used ] [ Generated: 19.07.25, 19:24 GMT ]