<?xml version='1.0' encoding="utf-8"?>
      <rss version='2.0'>
      <channel>
      <title>Форум на Исходниках.RU</title>
      <link>https://forum.sources.ru</link>
      <description>Форум на Исходниках.RU</description>
      <generator>Форум на Исходниках.RU</generator>
  	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=460680&amp;view=findpost&amp;p=3921886</guid>
        <pubDate>Wed, 07 May 2025 09:49:50 +0000</pubDate>
        <title>Метод извлечения информации</title>
        <link>https://forum.sources.ru/index.php?showtopic=460680&amp;view=findpost&amp;p=3921886</link>
        <description><![CDATA[babai-rais: <strong class='tag-b'>Альтернативный метод извлечения информации из звукового сигнала без спектрального анализа</strong><br>
<br>
Здравствуйте, коллеги.<br>
<br>
Хочу поделиться концепцией простого способа представления звукового сигнала, который может быть полезен для анализа речи, музыки и других аудиоформ. Метод не использует спектральный анализ, нейросети или шаблонное обучение. Вместо этого он опирается на регистрацию ритмических соотношений сигнала во времени — по сути, превращая его в цифровую азбуку Морзе.<br>
<br>
<strong class='tag-b'>Суть метода</strong><ul class="tag-list"><li>Считываем звуковой сигнал с частотой 1 кГц.</li><li>Определяем уровень шума — порог, ниже которого всё считается фоном.</li><li>Создаём задержанную копию сигнала (например, на 5 мс).</li><li>Если сигнал в текущий момент превышает порог — записываем <strong class='tag-b'>.</strong> (точка).</li><li>Если сигнал из линии задержки превышает порог — записываем <strong class='tag-b'>-</strong> (тире).</li><li>Если оба ниже — ничего не записываем.</li></ul><br>
В результате получаем последовательность событий, отражающую изменение частоты, ритма и структуры сигнала. Это не спектр и не шаблон, а своего рода частотно-временная морзянка.<br>
<br>
<br>
<strong class='tag-b'>Что даёт метод</strong><ul class="tag-list"><li>Простота: может быть реализован даже на микроконтроллерах.</li><li>Не зависит от громкости, тембра или скорости сигнала.</li><li>Позволяет строить кривые изменения высоты тона во времени.</li><li>Подходит для выделения нот, фрагментов речи и т.п.</li></ul><br>
<strong class='tag-b'>Псевдокод</strong><br>
<div class='tag-code'><span class='pre_code'></span><div class='code  code_collapsed ' title='Подсветка синтаксиса доступна зарегистрированным участникам Форума.' style=''><div><div><ol type="1"><div class="code_line">loop every 1ms:</div><div class="code_line">&nbsp;&nbsp; &nbsp;if signal(t_now) &#62; threshold:</div><div class="code_line">&nbsp;&nbsp; &nbsp; &nbsp; &nbsp;write(&quot;.&quot;)</div><div class="code_line">&nbsp;&nbsp; &nbsp;else if signal(t_now - delay) &#62; threshold:</div><div class="code_line">&nbsp;&nbsp; &nbsp; &nbsp; &nbsp;write(&quot;-&quot;)</div><div class="code_line">&nbsp;&nbsp; &nbsp;else:</div><div class="code_line">&nbsp;&nbsp; &nbsp; &nbsp; &nbsp;skip</div></ol></div></div></div></div><script>preloadCodeButtons('1');</script><br>
<br>
<strong class='tag-b'>Важно:</strong> я сам не занимаюсь программированием и не запускал код, надеюсь на помощь и комментарии тех, кто сможет реализовать эту идею практически. Сам алгоритм, по ощущениям, легко ложится в любую платформу — будь то Python, Arduino или даже простая цифровая логика.<br>
<br>
ИИ вроде ChatGPT может выдать код за минуту, но мне важно мнение опытных специалистов: стоит ли этим заниматься, какие тут подводные камни и есть ли практическая польза?<br>
<br>
С уважением,  <br>
<em class='tag-i'>[babai.rais</em>]]></description>
        <author>babai-rais</author>
        <category>Речевые Технологии</category>
      </item>
	
      </channel>
      </rss>
	