Версия для печати
Нажмите сюда для просмотра этой темы в оригинальном формате |
Форум на Исходниках.RU > Речевые Технологии > Как среагировать на определенный звук wav на компьютере |
Автор: ttt480 13.04.19, 02:08 |
Здравствуйте, уважаемые форумчане. Посоветуйте - какой программой можно заставить среагировать - на звучание на компьютере определенной мелодии длинной 2 секунды (не голоса а именно мелодии) ? Это файл C:\Windows\Media\tada.wav (при условии конечно, что одновременно нет звуков больше ни от каких других процессов) Вот нашел такую программу, которая строит изображение - звукового спектра tada.wav Вопрос в том, как сопоставить этот "эталонный" спектр" - общему потоку звукового звучания ? (Чтобы вовремя среагировать на него, когда в ОС появится звук с похожим спектром.) https://dropmefiles.com/Xvpqf Или может быть - еще какие-нибудь способы есть ? |
Автор: zamir 13.04.19, 06:45 |
Добрый день. DWT возможно вам подойдёт - https://habr.com/ru/post/135087/ |
Автор: ttt480 13.04.19, 08:50 |
zamir, ясно. А как запустить эту программу DWT, чтобы посмотреть как она работает ? |
Автор: ttt480 17.04.19, 08:56 |
zamir, может быть есть какая-то программа, выполняющая такую функцию ? |
Автор: zamir 17.04.19, 18:14 |
Возможно я не правильно понял предыдущий вопрос. При помощи DWT можно сравнивать. Чем меньше требуется транформаций тем более схожи сравниваемые последовательности. |
Автор: ttt480 25.04.19, 20:42 |
zamir, теория ясна. А есть ли какая-либо программа, которая умеет это делать ? Которая сумеет среагировать на знакомый звук ? |
Автор: zamir 01.05.19, 19:06 |
Код DWT приведён по ранее приведённой ссылке. Дать код чего-то работающего я вам не могу, так как у меня нет ничего на примете. Простую задачу обнаружения знакомого звука я решил просто при помощи обнаружения последовательностей схожих фреймов представленных mfcc (задача состоит в обнаружении звука пожарной сигнализации). Вероятно задачу можно решить проще и элегантнее, но я решал исходя из того, что было под рукой. |
Автор: ttt480 10.05.19, 09:45 |
Цитата zamir @ Простую задачу обнаружения знакомого звука я решил просто при помощи обнаружения последовательностей схожих фреймов представленных mfcc (задача состоит в обнаружении звука пожарной сигнализации). Вот я об этом как раз и говорю - обнаружение простого знакомого звука. Дайте пожалуйста ваш код, который это делает. |
Автор: ttt480 11.05.19, 09:52 |
zamir я имею ввиду - тот код, который обнаруживает последовательности схожих фреймов представленных mfcc |
Автор: Alexei 16.05.19, 08:24 |
Может корреляция поможет? Или можно просто выборки повычитать, сравнивая с эталоном. |
Автор: zamir 16.05.19, 19:07 |
Цитата ttt480 @ zamir я имею ввиду - тот код, который обнаруживает последовательности схожих фреймов представленных mfcc вроде как так не делается... вот мой говнокод: https://z1.prolink.ru/download/sound-detector.tar.gz дайте знать как загрузите... |
Автор: ttt480 23.05.19, 04:28 |
zamir спасибо за код. А как его запустить - там ведь экзешника нет ? |
Автор: zamir 23.05.19, 17:50 |
В архиве есть исполяемый код под linux (я забыл его удалить). Как собрать под windows не знаю (должно быть примерно также какже как компилировать код с opencv, но есть сомнения в отношении asound) Под linux: просто запутисить compile.sh (предварительно доставить opencv-dev и asound-dev) <{CODE_COLLAPSE_OFF}><{CODE_WRAP_OFF}> NAME=sound-detector g++ -Wall $NAME.cpp -o $NAME `pkg-config --cflags opencv` `pkg-config --libs opencv` -lasound -lm |
Автор: ttt480 29.05.19, 14:38 |
zamir, у меня нет линукса - только Windows. А под Windows как заставить этот код работать ? |
Автор: zamir 02.06.19, 09:50 |
Как собрать под windows не знаю (должно быть примерно также какже как компилировать код с opencv, но есть сомнения в отношении asound) Описание: https://www.deciphertechnic.com/install-ope...-visual-studio/ https://docs.opencv.org/2.4/doc/tutorials/i...ws_install.html linux можно загрузкить и установить бесплатно: https://distrowatch.com/ среду виртуализации под widnows можно также использовать бесплатно: https://www.virtualbox.org/ в windows 10 можно сразу поставить среду linux: https://docs.microsoft.com/ru-ru/windows/wsl/install-win10 Сообщения были разделены в тему "Перебросить звук с колонки" |
Автор: babai-rais 01.11.20, 13:17 |
Цитата Вопрос в том, как сопоставить этот "эталонный" спектр" - общему потоку звукового звучания ? В системах электросвязи эталонную частоту выделяют фильтрами. Если не важно какая мелодия эталонная то это самое лучшее готовое решение. Прослушайте мелодии тонального набора |