Версия для печати
Нажмите сюда для просмотра этой темы в оригинальном формате
Форум на Исходниках.RU > Речевые Технологии > Как среагировать на определенный звук wav на компьютере


Автор: ttt480 13.04.19, 02:08
Здравствуйте, уважаемые форумчане.

Посоветуйте - какой программой можно заставить среагировать - на звучание на компьютере определенной мелодии длинной 2 секунды (не голоса а именно мелодии) ?
Это файл C:\Windows\Media\tada.wav
(при условии конечно, что одновременно нет звуков больше ни от каких других процессов)

Вот нашел такую программу, которая строит изображение - звукового спектра tada.wav
Вопрос в том, как сопоставить этот "эталонный" спектр" - общему потоку звукового звучания ?
(Чтобы вовремя среагировать на него, когда в ОС появится звук с похожим спектром.)

https://dropmefiles.com/Xvpqf

Или может быть - еще какие-нибудь способы есть ?

Автор: zamir 13.04.19, 06:45
Добрый день.

DWT возможно вам подойдёт - https://habr.com/ru/post/135087/

Автор: ttt480 13.04.19, 08:50
zamir, ясно.
А как запустить эту программу DWT, чтобы посмотреть как она работает ?

Автор: ttt480 17.04.19, 08:56
zamir, может быть есть какая-то программа, выполняющая такую функцию ?

Автор: zamir 17.04.19, 18:14
Возможно я не правильно понял предыдущий вопрос.
При помощи DWT можно сравнивать. Чем меньше требуется транформаций тем более схожи сравниваемые последовательности.

Автор: ttt480 25.04.19, 20:42
zamir, теория ясна.
А есть ли какая-либо программа, которая умеет это делать ?
Которая сумеет среагировать на знакомый звук ?

Автор: zamir 01.05.19, 19:06
Код DWT приведён по ранее приведённой ссылке.
Дать код чего-то работающего я вам не могу, так как у меня нет ничего на примете.
Простую задачу обнаружения знакомого звука я решил просто при помощи обнаружения последовательностей схожих фреймов представленных mfcc (задача состоит в обнаружении звука пожарной сигнализации). Вероятно задачу можно решить проще и элегантнее, но я решал исходя из того, что было под рукой.

Автор: ttt480 10.05.19, 09:45
Цитата zamir @
Простую задачу обнаружения знакомого звука я решил просто при помощи обнаружения последовательностей схожих фреймов представленных mfcc (задача состоит в обнаружении звука пожарной сигнализации).

Вот я об этом как раз и говорю - обнаружение простого знакомого звука.

Дайте пожалуйста ваш код, который это делает.

Автор: ttt480 11.05.19, 09:52
zamir я имею ввиду - тот код, который обнаруживает последовательности схожих фреймов представленных mfcc

Автор: Alexei 16.05.19, 08:24
Может корреляция поможет? Или можно просто выборки повычитать, сравнивая с эталоном.

Автор: zamir 16.05.19, 19:07
Цитата ttt480 @
zamir я имею ввиду - тот код, который обнаруживает последовательности схожих фреймов представленных mfcc

вроде как так не делается...
вот мой говнокод: https://z1.prolink.ru/download/sound-detector.tar.gz
дайте знать как загрузите...

Автор: ttt480 23.05.19, 04:28
zamir спасибо за код.

А как его запустить - там ведь экзешника нет ?

Автор: zamir 23.05.19, 17:50
В архиве есть исполяемый код под linux (я забыл его удалить).
Как собрать под windows не знаю (должно быть примерно также какже как компилировать код с opencv, но есть сомнения в отношении asound)
Под linux: просто запутисить compile.sh (предварительно доставить opencv-dev и asound-dev)

<{CODE_COLLAPSE_OFF}><{CODE_WRAP_OFF}>
    NAME=sound-detector
    g++ -Wall $NAME.cpp -o $NAME `pkg-config --cflags opencv` `pkg-config --libs opencv` -lasound -lm

Автор: ttt480 29.05.19, 14:38
zamir, у меня нет линукса - только Windows.
А под Windows как заставить этот код работать ?

Автор: zamir 02.06.19, 09:50
Как собрать под windows не знаю (должно быть примерно также какже как компилировать код с opencv, но есть сомнения в отношении asound)

Описание:
https://www.deciphertechnic.com/install-ope...-visual-studio/
https://docs.opencv.org/2.4/doc/tutorials/i...ws_install.html

linux можно загрузкить и установить бесплатно: https://distrowatch.com/
среду виртуализации под widnows можно также использовать бесплатно: https://www.virtualbox.org/
в windows 10 можно сразу поставить среду linux: https://docs.microsoft.com/ru-ru/windows/wsl/install-win10

Сообщения были разделены в тему "Перебросить звук с колонки"

Автор: babai-rais 01.11.20, 13:17
Цитата
Вопрос в том, как сопоставить этот "эталонный" спектр" - общему потоку звукового звучания ?

В системах электросвязи эталонную частоту выделяют фильтрами. Если не важно какая мелодия эталонная то это самое лучшее готовое решение.
Прослушайте мелодии тонального набора

Powered by Invision Power Board (https://www.invisionboard.com)
© Invision Power Services (https://www.invisionpower.com)