<?xml version='1.0' encoding="utf-8"?>
      <rss version='2.0'>
      <channel>
      <title>Форум на Исходниках.RU</title>
      <link>https://forum.sources.ru</link>
      <description>Форум на Исходниках.RU</description>
      <generator>Форум на Исходниках.RU</generator>
  	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=355337&amp;view=findpost&amp;p=3397340</guid>
        <pubDate>Sun, 12 Jan 2014 21:31:22 +0000</pubDate>
        <title>Оценка качества MFCC</title>
        <link>https://forum.sources.ru/index.php?showtopic=355337&amp;view=findpost&amp;p=3397340</link>
        <description><![CDATA[zamir: Если я всё правильно понимаю, то результат у меня получился не хуже<br>
<br>
в примерах <a class='tag-url' href='http://web.mit.edu/jvb/www/signalrec/' target='_blank'>http://web.mit.edu/jvb/www/signalrec/</a><br>
частота дискретизации: 14700Гц<br>
длина окна: 200 значений (либо 100? - 100 sample STFT window size, 200 FFT bins per window)<br>
шаг окна в примерах судя повсему обозначен как Hop Size<br>
<br>
у меня:<br>
частота дискретизации: 8000Гц<br>
длина окна - 256 значений<br>
восстановление при шаге в 10 значений - <a class='tag-url' href='http://z1.prolink.ru/download/wave_from_spectrum_step10.wav' target='_blank'>файл</a><br>
восстановление при шаге в 30 значений - <a class='tag-url' href='http://z1.prolink.ru/download/wave_from_spectrum_step30.wav' target='_blank'>файл</a><br>
восстановление при шаге в 50 значений - <a class='tag-url' href='http://z1.prolink.ru/download/wave_from_spectrum_step50.wav' target='_blank'>файл</a><br>
восстановление при шаге в 70 значений - <a class='tag-url' href='http://z1.prolink.ru/download/wave_from_spectrum_step70.wav' target='_blank'>файл</a><br>
восстановление при шаге в 80 значений - <a class='tag-url' href='http://z1.prolink.ru/download/wave_from_spectrum_step80.wav' target='_blank'>файл</a> <br>
<br>
<span class="tag-color tag-color-named" data-value="gray" style="color: gray"><span class='tag-size' data-value='7' style='font-size:7pt;'>Добавлено <time class="tag-mergetime" datetime="2014-01-13T01:46:43+04:00">12.01.14, 21:46</time></span></span><br>
В дополнении синтезированный звук <a class='tag-url' href='http://z1.prolink.ru/download/wave_from_spectrum_synth_v1.wav' target='_blank'>файл</a>]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=355337&amp;view=findpost&amp;p=3396961</guid>
        <pubDate>Sat, 11 Jan 2014 12:41:40 +0000</pubDate>
        <title>Оценка качества MFCC</title>
        <link>https://forum.sources.ru/index.php?showtopic=355337&amp;view=findpost&amp;p=3396961</link>
        <description><![CDATA[zamir: Получилось немного получше<br>
<br>
восстановление фазы оригинального звука<br>
<img class='tag-img' src='http://z1.prolink.ru/download/wave_from_mfcc_and_phasegen_7.png' alt='user posted image'><br>
<a class='tag-url' href='http://z1.prolink.ru/download/wave_from_mfcc_and_phasegen_7_new2.wav' target='_blank'>полученый wav файл</a><br>
<br>
<br>
восстановление фазы синтезированного звука<br>
<img class='tag-img' src='http://z1.prolink.ru/download/wave_from_mfcc_and_phasegen_6.png' alt='user posted image'><br>
<a class='tag-url' href='http://z1.prolink.ru/download/wave_from_mfcc_and_phasegen_6_new2.wav' target='_blank'>полученый wav файл</a><br>
<br>
Я так понимаю основная загвоздка всё таки в основном тоне...]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=355337&amp;view=findpost&amp;p=3396663</guid>
        <pubDate>Fri, 10 Jan 2014 15:45:43 +0000</pubDate>
        <title>Оценка качества MFCC</title>
        <link>https://forum.sources.ru/index.php?showtopic=355337&amp;view=findpost&amp;p=3396663</link>
        <description><![CDATA[zamir: Спасибо Николай&#33;<br>Математикам при жизни надо ставить памятник =) Даже после такого подробного объяснения я до конца не прозрел.]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=355337&amp;view=findpost&amp;p=3395432</guid>
        <pubDate>Wed, 08 Jan 2014 20:51:08 +0000</pubDate>
        <title>Оценка качества MFCC</title>
        <link>https://forum.sources.ru/index.php?showtopic=355337&amp;view=findpost&amp;p=3395432</link>
        <description><![CDATA[nsh: <div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>Если не сложно посмотрите пожалуйста example 1<br>
<a class='tag-url' href='http://www.eurasip.org/Proceedings/Eusipco.../1569579067.pdf' target='_blank'>http://www.eurasip.org/Proceedings/Eusipco.../1569579067.pdf</a></div></div><br>
<br>
Статья несколько ни о чем, да и задача тут другая. Есть много задач где измеряется |X|^2 в нескольких точках и нужно восстановить X (в томогарфии, например). Эта статья о такой задаче где число точек измерения меньше чем число точек оригинальной последовательности.<br>
<br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>Какой смысл несёт в себе функция S(w)?</div></div><br>
<br>
Смысла у функции нет, а сама из себя она представляет квадрат модуля преобразования Фурье дискретной последовательности. Авторы пытаются использовать её в качестве критерия разрешимости задачи обращения, но у них выходит с переменным успехом. В задачах, где измеряется |X|^2, не очевидно, имеет ли задача восстановления решение.<br>
<br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>Эту функцию можно использовать например для получения отношений фаз?</div></div><br>
<br>
Не отношения фаз с помощью неё можно вычислить, отношений фаз в этой задаче нет, а просто восстанавливать сигнал. Сигнал вычисляется с помощью нахождения корней комплексного полинома.<br>
<br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>1.2 это 0.6+0.6 или abs(0.6)+abs(0.6) или что-то другое?</div></div><br>
<br>
1.2 это 0.6 + 0.6 (F(n) = sum&#092;n x_n (cos wn + i sin wn))<br>
<br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>Как были получены реальные значения сигнала 1.0736... ?</div></div><br>
<br>
Уравнение четвертой степени решили (a + be^iw + c^e^2iw)^2 = 1.6 + 1.2 cosw + 1.2 cos2w]]></description>
        <author>nsh</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=355337&amp;view=findpost&amp;p=3395238</guid>
        <pubDate>Tue, 07 Jan 2014 21:11:47 +0000</pubDate>
        <title>Оценка качества MFCC</title>
        <link>https://forum.sources.ru/index.php?showtopic=355337&amp;view=findpost&amp;p=3395238</link>
        <description><![CDATA[zamir: Буксую..<br>
Если не сложно посмотрите пожалуйста example 1<br>
<a class='tag-url' href='http://www.eurasip.org/Proceedings/Eusipco/Eusipco2012/Conference/papers/1569579067.pdf' target='_blank'>http://www.eurasip.org/Proceedings/Eusipco.../1569579067.pdf</a><br>
<br>
Какой смысл несёт в себе функция S(w)? Эту фунцию можно использовать например для получения отношений фаз?<br>
<br>
S(w)=1.6+1.2cos(w)+1.2cos(2w)<br>
<br>
<a class='tag-url' href='http://www.wolframalpha.com/input/?i=S%28w%29%3D1.6%2B1.2cos%28w%29%2B1.2cos%282w%29' target='_blank'>http://www.wolframalpha.com/input/?i=S%28w...B1.2cos%282w%29</a><br>
<br>
1.2 это 0.6+0.6 или abs(0.6)+abs(0.6) или что-то другое?<br>
<br>
Как были получены реальные значения сигнала 1.0736... ?]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=355337&amp;view=findpost&amp;p=3394232</guid>
        <pubDate>Wed, 01 Jan 2014 17:38:25 +0000</pubDate>
        <title>Оценка качества MFCC</title>
        <link>https://forum.sources.ru/index.php?showtopic=355337&amp;view=findpost&amp;p=3394232</link>
        <description><![CDATA[zamir: Спасибо что проверили и подтвердили, что с этой задачей не всё так гладко.<br>
<br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '><br>
If your processing requires the use Hamming/Hanning or other non-rectangular windows to compute the STFT, the methods described herein will probably not give good results.</div></div><br>
Треугольное окно не лучший вариант для получения FFT. У меня окно схоже с Hamming.<br>
<br>
Я вроде видел статью где используется линейное прогнозирование (аналог LPC) для восстановления фазы. (возможно там речь о чём-то другом шла и я что-то путаю)<br>
Пробую решить задачу реверс-инжинирингом 8-)]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=355337&amp;view=findpost&amp;p=3394215</guid>
        <pubDate>Wed, 01 Jan 2014 15:26:43 +0000</pubDate>
        <title>Оценка качества MFCC</title>
        <link>https://forum.sources.ru/index.php?showtopic=355337&amp;view=findpost&amp;p=3394215</link>
        <description><![CDATA[nsh: <div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>Задача сгенерить фазу исходя из спектра.</div></div><br>
<br>
После исследования вопроса можно сказать, что эта задача непростая. С потерянной фазой восстановить сигнал трудно, например, вот статья на эту тему:<br>
<br>
<a class='tag-url' href='http://web.mit.edu/jvb/www/papers/signalrec_ICSLP06.pdf' target='_blank'>http://web.mit.edu/jvb/www/papers/signalrec_ICSLP06.pdf</a><br>
<br>
Примеры к этой статье можно послушать здесь:<br>
<br>
<a class='tag-url' href='http://web.mit.edu/jvb/www/signalrec/' target='_blank'>http://web.mit.edu/jvb/www/signalrec/</a><br>
<br>
Кстати, код для экспериментов на numpy можно использовать такой:<br>
<br>
<div class='tag-code'><span class='pre_code'></span><div class='code  code_collapsed ' title='Подсветка синтаксиса доступна зарегистрированным участникам Форума.' style=''><div><div><ol type="1"><div class="code_line">import numpy as np</div><div class="code_line">import numpy.fft as fft</div><div class="code_line">from scipy.io.wavfile import read, write</div><div class="code_line">&nbsp;</div><div class="code_line">fshift = 100</div><div class="code_line">wlen = 256</div><div class="code_line">nfft = wlen</div><div class="code_line">window = np.hanning(wlen)</div><div class="code_line">&nbsp;</div><div class="code_line">rate, sig = read(&quot;test.wav&quot;)</div><div class="code_line">nfr = int(sig.shape[0] / fshift + 1)</div><div class="code_line">out_sig = np.zeros(sig.shape, &#39;int16&#39;)</div><div class="code_line">&nbsp;&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;</div><div class="code_line">for fr in range(0, nfr):</div><div class="code_line">&nbsp;&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;</div><div class="code_line">&nbsp;&nbsp; &nbsp;start = round(fr * fshift)</div><div class="code_line">&nbsp;&nbsp; &nbsp;end = min(len(sig), start + wlen)</div><div class="code_line">&nbsp;&nbsp; &nbsp;frame = sig[start:end]</div><div class="code_line">&nbsp;&nbsp; &nbsp;if len(frame) &#60; wlen:</div><div class="code_line">&nbsp;&nbsp; &nbsp; &nbsp; &nbsp;break</div><div class="code_line">&nbsp;</div><div class="code_line">&nbsp;&nbsp; &nbsp;frame = frame * window</div><div class="code_line">&nbsp;&nbsp; &nbsp;frame_fft = fft.rfft(frame, nfft)</div><div class="code_line">&nbsp;&nbsp; &nbsp;amplitudes = abs(frame_fft)</div><div class="code_line">&nbsp;&nbsp; &nbsp;ph = np.random.uniform(0, 2*np.pi, amplitudes.shape) * 1j</div><div class="code_line">&nbsp;&nbsp; &nbsp;amplitudes *= np.exp(ph)</div><div class="code_line">&nbsp;&nbsp; &nbsp;restored_frame = fft.irfft(amplitudes) * window</div><div class="code_line">&nbsp;</div><div class="code_line">&nbsp;&nbsp; &nbsp;out_sig[start:end] = out_sig[start:end] + restored_frame.astype(np.int16)</div><div class="code_line">&nbsp;</div><div class="code_line">write(&#39;test_out.wav&#39;, rate, out_sig)</div></ol></div></div></div></div><script>preloadCodeButtons('1');</script>]]></description>
        <author>nsh</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=355337&amp;view=findpost&amp;p=3394096</guid>
        <pubDate>Tue, 31 Dec 2013 17:59:59 +0000</pubDate>
        <title>Оценка качества MFCC</title>
        <link>https://forum.sources.ru/index.php?showtopic=355337&amp;view=findpost&amp;p=3394096</link>
        <description><![CDATA[zamir: Задача сгенерить фазу исходя из спектра.<br>
Вроде общий смысл уловил. Буду пробовать. <br>
<br>
<span class="tag-color tag-color-named" data-value="gray" style="color: gray"><span class='tag-size' data-value='7' style='font-size:7pt;'>Добавлено <time class="tag-mergetime" datetime="2013-12-31T18:58:12+00:00">31.12.13, 18:58</time></span></span><br>
С восстановлением при помощи белого шума поправдоподобнее получается.<br>
<br>
восстановление вазы ориганльного звука<br>
<img class='tag-img' src='http://z1.prolink.ru/download/wave_from_mfcc_and_phasegen_7.png' alt='user posted image'><br>
<a class='tag-url' href='http://z1.prolink.ru/download/wave_from_mfcc_and_phasegen_7.wav' target='_blank'>полученый wav файл</a><br>
очень похоже на то что получается при восстановление ориганльной фазы с подмешанным шумом<br>
<br>
восстановление фазы синтезированного звука<br>
<img class='tag-img' src='http://z1.prolink.ru/download/wave_from_mfcc_and_phasegen_6.png' alt='user posted image'><br>
<a class='tag-url' href='http://z1.prolink.ru/download/wave_from_mfcc_and_phasegen_6_new.wav' target='_blank'>полученый wav файл</a><br>
<br>
для сравнения<br>
<a class='tag-url' href='http://z1.prolink.ru/download/wave_original_nr.wav' target='_blank'>оригинальная фаза с подмешанным шумов</a><br>
<a class='tag-url' href='http://z1.prolink.ru/download/wave_original_wonr.wav' target='_blank'>оригинальная фаза</a><br>
<br>
P.S. пользуясь случаем: С Новым Годом&#33; ;)]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=355337&amp;view=findpost&amp;p=3393896</guid>
        <pubDate>Mon, 30 Dec 2013 18:45:44 +0000</pubDate>
        <title>Оценка качества MFCC</title>
        <link>https://forum.sources.ru/index.php?showtopic=355337&amp;view=findpost&amp;p=3393896</link>
        <description><![CDATA[zamir: Помогите пожалуйста синтезом на основе спектра<br>
После создания спектрограммы пытаюсь на основе её синтезировать звуковую волну<br>
<img class='tag-img' src='http://z1.prolink.ru/download/wave_from_mfcc_and_phasegen_6.png' alt='user posted image'><br>
проблема заключается в том, что после синтеза основной тон принимает статический вид и звук получается роботизированным<br>
<a class='tag-url' href='http://z1.prolink.ru/download/wave_from_mfcc_and_phasegen_6.wav' target='_blank'>полученый wav файл</a>]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=355337&amp;view=findpost&amp;p=3279678</guid>
        <pubDate>Tue, 26 Feb 2013 06:34:15 +0000</pubDate>
        <title>Оценка качества MFCC</title>
        <link>https://forum.sources.ru/index.php?showtopic=355337&amp;view=findpost&amp;p=3279678</link>
        <description><![CDATA[zamir: В заключении сравнение спектров<br>
<br>
Оригинальный спектр:<br>
<img class='tag-img' src='http://z1.prolink.ru/download/spectrum_original.png' alt='user posted image'><br>
<br>
Спектр восстановленный из MFCC:<br>
<img class='tag-img' src='http://z1.prolink.ru/download/spectrum_from_mfcc.png' alt='user posted image'><br>
<br>
Кстати если сделать преобразование Фурье от спектра (кепстр), затем почистить кепстр (удалить всё кроме крайних 10 коэфициентов например) и возвратить спектр при помощи обратного преобразования фурье - то получится точно такая же картина (ну или очень-очень похожая)<br>
Для другого сигнала спектр восстановленный из фильтрованного кепстра выглядит так:<br>
<img class='tag-img' src='http://z1.prolink.ru/download/spectrum_from_cepstrum.png' alt='user posted image'>]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=355337&amp;view=findpost&amp;p=3279580</guid>
        <pubDate>Mon, 25 Feb 2013 18:40:56 +0000</pubDate>
        <title>Оценка качества MFCC</title>
        <link>https://forum.sources.ru/index.php?showtopic=355337&amp;view=findpost&amp;p=3279580</link>
        <description><![CDATA[zamir: Варианты создания фазы и спектра (придумал пока ехал в метро):<br>
<br>
<a class='tag-url' href='http://z1.prolink.ru/download/wave_from_mfcc_and_phasegen_3.wav' target='_blank'>вариант 1</a><br>
<a class='tag-url' href='http://z1.prolink.ru/download/wave_from_mfcc_and_phasegen_4.wav' target='_blank'>вариант 2</a><br>
<a class='tag-url' href='http://z1.prolink.ru/download/wave_from_mfcc_and_phasegen_5.wav' target='_blank'>вариант 3</a><br>
<br>
помоему это максимум что можно сделать.<br>
Причём при увеличении колличества DCT коэфициентов до 31, качество на слух не улучшается (спектр в определённых местах только усиливается)<br>
<br>
<a class='tag-url' href='http://z1.prolink.ru/download/wave_from_mfcc31_and_phasegen.wav' target='_blank'>31 коэфициент для сравнения</a>]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=355337&amp;view=findpost&amp;p=3279426</guid>
        <pubDate>Mon, 25 Feb 2013 12:32:09 +0000</pubDate>
        <title>Оценка качества MFCC</title>
        <link>https://forum.sources.ru/index.php?showtopic=355337&amp;view=findpost&amp;p=3279426</link>
        <description><![CDATA[zamir: Судя по всему я так и не понимаю физический смысл фазы<br>
Вот ещё один вариант восстановления фазы<br>
Фактически я беру как выразился NegroFinn &quot;фазовращатель&quot; с определённой статической частотой<br>
Одной из попыток улучшить качество было подбор смещения фазы на столько что бы основной тон попадал на значение PI<br>
Кто-нибудь сможет предложить более изящное решение для восстановления фазы с целью создания звуковой волны из спектра?<br>
<br>
<a class='tag-url' href='http://z1.prolink.ru/download/wave_from_mfcc_and_phasegen_2.wav' target='_blank'>ещё один вариант восстановления фазы</a><br>
<br>
Кстати основной тон всё таки сохраняется при 13и коэфициентах похоже, так как дикторы различаются, хотя может я и не по основному тону распознаю...]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=355337&amp;view=findpost&amp;p=3278881</guid>
        <pubDate>Sun, 24 Feb 2013 13:43:37 +0000</pubDate>
        <title>Оценка качества MFCC</title>
        <link>https://forum.sources.ru/index.php?showtopic=355337&amp;view=findpost&amp;p=3278881</link>
        <description><![CDATA[zamir: До этого восстановление было при помощи сохрашённой фазы<br>
Новый эскпеример: Восстановление из MFCC с примитивным методом генерирования фазы<br>
<br>
<a class='tag-url' href='http://z1.prolink.ru/download/wave_from_mfcc_and_phasegen.wav' target='_blank'>звук востановлен только из MFCC</a><br>
<br>
Разница между мужской и женской речью пропала. Pitch и DCT творят чудеса =)]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=355337&amp;view=findpost&amp;p=3278080</guid>
        <pubDate>Fri, 22 Feb 2013 06:43:21 +0000</pubDate>
        <title>Оценка качества MFCC</title>
        <link>https://forum.sources.ru/index.php?showtopic=355337&amp;view=findpost&amp;p=3278080</link>
        <description><![CDATA[zamir: Очередной эксперимент<br>
Берём 31 MFCC коэфициент<br>
Начинаем гасить их начиная с 1-го (1-й энергия. её я не гасил а выставлял статической)<br>
Получем следующую картину:<br>
<br>
<a class='tag-url' href='http://z1.prolink.ru/download/wave_1k_down.wav' target='_blank'>энергия 1-го коэф. в статике</a><br>
<a class='tag-url' href='http://z1.prolink.ru/download/wave_2k_down.wav' target='_blank'>дополнительно погашен 2й коэфициент</a><br>
<a class='tag-url' href='http://z1.prolink.ru/download/wave_3k_down.wav' target='_blank'>дополнительно погашен 3й коэфициент</a><br>
<a class='tag-url' href='http://z1.prolink.ru/download/wave_4k_down.wav' target='_blank'>дополнительно погашен 4й коэфициент</a><br>
<a class='tag-url' href='http://z1.prolink.ru/download/wave_5k_down.wav' target='_blank'>дополнительно погашен 5й коэфициент</a><br>
<br>
Больше 5ти коэфициентов гасить нет стал... ситуация более менее понятная]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=355337&amp;view=findpost&amp;p=3272368</guid>
        <pubDate>Mon, 11 Feb 2013 10:18:39 +0000</pubDate>
        <title>Оценка качества MFCC</title>
        <link>https://forum.sources.ru/index.php?showtopic=355337&amp;view=findpost&amp;p=3272368</link>
        <description><![CDATA[zamir: Вот как меняется спектр:<br>
<br>
Орининальный звук<br>
<img class='tag-img' src='http://z1.prolink.ru/download/wav_original.png' alt='user posted image'><br>
<br>
Звук восстановленный из фильтра с 31 банком<br>
<img class='tag-img' src='http://z1.prolink.ru/download/wav_from_filter.png' alt='user posted image'><br>
<br>
Звук восстановленный из 13 коэфициентов MFCC<br>
<img class='tag-img' src='http://z1.prolink.ru/download/wav_from_mfcc.png' alt='user posted image'> <br>
<br>
<span class="tag-color tag-color-named" data-value="gray" style="color: gray"><span class='tag-size' data-value='7' style='font-size:7pt;'>Добавлено <time class="tag-mergetime" datetime="2013-02-11T11:06:24+00:00">11.02.13, 11:06</time></span></span><br>
Я похоже не учёл пропорции колличества энергии MEL фильтра. Из-за этого амплитуда высоких частот выросла по сравнению с низкими частотами.]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=355337&amp;view=findpost&amp;p=3272137</guid>
        <pubDate>Sun, 10 Feb 2013 16:30:27 +0000</pubDate>
        <title>Оценка качества MFCC</title>
        <link>https://forum.sources.ru/index.php?showtopic=355337&amp;view=findpost&amp;p=3272137</link>
        <description><![CDATA[zamir: Вот что получилось:<br>
<br>
<a class='tag-url' href='http://z1.prolink.ru/download/wave_original.wav' target='_blank'>Орининальный звук</a>:<br>
<br>
<a class='tag-url' href='http://z1.prolink.ru/download/wave_from_filter.wav' target='_blank'>Звук восстановленный из фильтра с 31 банком</a><br>
<br>
<a class='tag-url' href='http://z1.prolink.ru/download/wave_from_mfcc.wav' target='_blank'>Звук восстановленный из 13 коэфициентов MFCC</a><br>
<br>
Амплитуда после преобразований почему-то немного увеличивается и дело доходит до треска...]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=355337&amp;view=findpost&amp;p=3119581</guid>
        <pubDate>Mon, 16 Apr 2012 13:40:45 +0000</pubDate>
        <title>Оценка качества MFCC</title>
        <link>https://forum.sources.ru/index.php?showtopic=355337&amp;view=findpost&amp;p=3119581</link>
        <description><![CDATA[NegroFinn: а че там думать: в лоб по матем формулам.  правда характеристики несущей (тон-шум) ты в такмо случае НЕ восстановишь и догадываться где были шпиящие будеь  лишь по спектру<br><br><br>а ваще была статья по прямоу синтозу из мфцц. там все просто:<br>кепстр-коэффициенту соответствует фильтр у которого коэффициенты равны разложению в ряд тейлора ехроненты.<br>а для учета мела там в тапах фильтра стоят фазовращатели подобранные так чтобы смаппировать с меловой шкалы на обычную обратно.]]></description>
        <author>NegroFinn</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=355337&amp;view=findpost&amp;p=3117505</guid>
        <pubDate>Fri, 13 Apr 2012 04:31:44 +0000</pubDate>
        <title>Оценка качества MFCC</title>
        <link>https://forum.sources.ru/index.php?showtopic=355337&amp;view=findpost&amp;p=3117505</link>
        <description><![CDATA[zamir: Подскажите пожалуйста программные средства для оценки качества получаемых MFCC<br>
Интресуют так же средства позволяющие восстановить речь или спектр из MFCC (<a class='tag-url' href='http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.62.1968&rep=rep1&type=pdf' target='_blank'>http://citeseerx.ist.psu.edu/viewdoc/downl...p=rep1&type=pdf</a>)]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      </channel>
      </rss>
	