<?xml version='1.0' encoding="utf-8"?>
      <rss version='2.0'>
      <channel>
      <title>Форум на Исходниках.RU</title>
      <link>https://forum.sources.ru</link>
      <description>Форум на Исходниках.RU</description>
      <generator>Форум на Исходниках.RU</generator>
  	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3366214</guid>
        <pubDate>Sat, 19 Oct 2013 08:28:55 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3366214</link>
        <description><![CDATA[nsh: <div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>хорошо заметны недостатки по сравнению с RHVoice</div></div><br>
<br>
RHVoice наверное более новый HTS использует вроде 2.1. С версии 1.1 много воды утекло<br>
<br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>Стоит ли специально для этого делать фестивалевский голос - непонятно. </div></div><br>
<br>
До HTS голоса надо обязательно делать и тестировать unit-selection, это позволяет значительно улучшить качесто HTS голоса.<br>
<br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>Кроме того, отдельные ошибки в базе, транскрипциях и словарях также будут нивелироваться за счет объема. </div></div><br>
<br>
Не будут. Дело в том, что HTS делает на одном из этапов кластеризацию аллофонов, и ошибки только усиливаются, кроме того, их становится тяжелее ловить.<br>
<br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>Есть ли какие-нибудь эффективные алгоритмы их предсказания?</div></div><br>
<br>
Нет.<br>
<br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>Из словаря фестиваля? </div></div><br>
<br>
Из любого словаря.]]></description>
        <author>nsh</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3365429</guid>
        <pubDate>Thu, 17 Oct 2013 09:47:14 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3365429</link>
        <description><![CDATA[gsp: Удалось решить проблему с затуханием звука в HMM-голосе. Дело было в алгоритме Global Variance, который на дефолтовых настройках приводил к клиппингу на ударных гласных. Теперь на коротких фразах звучит неплохо. Однако на длинных фразах хорошо заметны недостатки по сравнению с RHVoice:<br>
1. Некоторые звуки все равно синтезируются с дефектами. Хотя в RHVoice (судя по скриптам) используется тот же ehmm labeling. Возможно, стоит поэкспериментировать с фичами? Нет ли каких-нибудь рекомендаций?<br>
2. Голос несколько зашумлен. В RHVoice голос более чистый, хотя и проскакивает металлический призвук иногда. Пробовал менять FREQWARPв настройках hts, но желаемого эффекта пока не добился.<br>
3. Интонация и паузы. RHVoice чуть медленнее (rate=0.7) и субъективно более выразительный, с расстановкой. Можно сравнить по прикрепленным файлам. Это какие-то упущения тренировки или особенности реализации синтеза marytts и flite?<br>
4. Обнаружилось, что pitch выглядит более дискретным по сравнению с RHVoice. Не знаю, стоит ли беспокоиться по этому поводу.<br>
<br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>Судя по примерам выложенным, разметка ужасная, очень много дефектов при склейке. Синтез фраз из базы как раз ни о чём не говорит, потому что проблемы возникают при склейке из разных частей базы.</div></div><br>
Правильно ли я понял ваш предыдущий пост, что добиться качественной разметки на таком объеме базы проблематично? На большем объеме hmm будут лучше натренированы - качество разметки возрастет. Кроме того, отдельные ошибки в базе, транскрипциях и словарях также будут нивелироваться за счет объема. Выглядящее наиболее перспективным техническое средство - move_label - работает только с фестивалевскими голосами, как я понял. Стоит ли специально для этого делать фестивалевский голос - непонятно. <br>
<br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>С ударениями тоже очень большие проблемы, Mary их просто не умеет предсказывать: переходил, замаранные, покину. Только если ударения исправить, будет значительно лучше.</div></div><br>
Да, с ударениями надо что-то делать. Есть ли какие-нибудь эффективные алгоритмы их предсказания?<br>
<br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>Ударения нужно брать из словаря.</div></div><br>
Из словаря фестиваля?]]></description>
        <author>gsp</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3362655</guid>
        <pubDate>Wed, 09 Oct 2013 13:07:12 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3362655</link>
        <description><![CDATA[nsh: <div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>В целом разметка, как я понял (по практически идеальному синтезу фраз, на которых происходило обучение), делается сносно. </div></div><br>
<br>
Судя по примерам выложенным, разметка ужасная, очень много дефектов при склейке. Синтез фраз из базы как раз ни о чём не говорит, потому что проблемы возникают при склейке из разных частей базы.<br>
<br>
С ударениями тоже очень большие проблемы, Mary их просто не умеет предсказывать: переходил, замаранные, покину. Только если ударения исправить, будет значительно лучше.<br>
<br>
Ударения нужно брать из словаря.]]></description>
        <author>nsh</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3362549</guid>
        <pubDate>Wed, 09 Oct 2013 09:15:18 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3362549</link>
        <description><![CDATA[gsp: Спасибо за такой подробный ответ&#33;<br>
<br>
Убавил громкость исходный файлов. Еще обнаружил, что в фонетическом словаре marytts, который используется по умолчанию, отсутствует приблизительно 10% слов из обучающего множества. После их добавления стало немного получше. Обнаружил в фестивалевском словаре и обучающих фразах несколько косяков с &quot;ё&quot; (&quot;ребенок&quot;, &quot;летчик&quot;).<br>
<br>
В целом разметка, как я понял (по практически идеальному синтезу фраз, на которых происходило обучение), делается сносно. Основная проблема, действительно, в небольшом размере самой базы. В открытом доступе есть еще Irina, размер которой в 3 раза больше. С аудиокнигой на первых порах, я думаю, не справлюсь, т.к. усилий на подготовку материала потребуется гораздо больше.<br>
<br>
Пишут, что HMM-синтез лишен некоторых недостатков, присущих unit selection. Попробовал натренировать HMM все на той же Елене. Получилось вроде бы неплохо, в плане &quot;гладкости&quot; похоже на RHVoice. Но откуда-то вылезла проблема с затуханием звука, пробую сейчас разобраться.<br>
<br>
Пробую еще раз приложить аудио файлы (формат - ogg).<br>
<span class="b-attach" data-size="58034" data-hits="809" data-attach-id="32031" data-attach-post-id="3362549">
			<span class="b-attach__title"></span><a class='b-attach-link' href='https://forum.sources.ru/index.php?act=Attach&amp;type=post&amp;id=3362549&amp;attach_id=32031' title='Скачать файл' target='_blank'>elena_unitsel3.txt</a> (, : 809)
		</span><br>
<span class="b-attach" data-size="47394" data-hits="784" data-attach-id="32032" data-attach-post-id="3362549">
			<span class="b-attach__title"></span><a class='b-attach-link' href='https://forum.sources.ru/index.php?act=Attach&amp;type=post&amp;id=3362549&amp;attach_id=32032' title='Скачать файл' target='_blank'>elena_hmm1.txt</a> (, : 784)
		</span>]]></description>
        <author>gsp</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3361036</guid>
        <pubDate>Thu, 03 Oct 2013 18:14:55 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3361036</link>
        <description><![CDATA[nsh: <div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>Пример - во [attach=#0]вложении[/attach].<br>
</div></div><br>
<br>
Чего-то нет вложения.<br>
<br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>1. Иногда при синтезе этим голосом в консоли сервера выводится предупреждение &quot;Warning: signal amplitude out of range: 32957&quot;. Стоит убавить громкость исходным файлам? Или проблема решается как-то по-другому?<br>
</div></div><br>
<br>
Да, громкость нужно нормализовать в процессе обработки. По-моему, в openmary такая функция есть, хотя я не помню. Если нет, нужно сделать это отдельно.<br>
<br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>2. Имеет ли вообще смысл делать какую-либо предобработку исходного аудио? Выравнивание громкости, например? Есть ли какие-нибудь инструкции для подготовки аудио к тренировке?<br>
</div></div><br>
<br>
Чем меньше обработки, тем лучше. Но громкость надо бы выровнять.<br>
<br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>3. Перед тренировкой я перегнал исходные файлы из 44.1 КГЦ в 16. Имеет ли смысл пробовать перетренировать на 44.1 КГц? </div></div><br>
<br>
Нет.<br>
<br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>Теоретически при перегонке из-за некратных частот могли возникнуть какие-то артефакты в исходный файлах.</div></div><br>
<br>
Не могли.<br>
<br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>4. Есть ли какие-нибудь способы проверить качество разметки (ehmm labeling)? Повысить это качество?<br>
</div></div><br>
<br>
Открыть файл разметки lab в wavesurfer или praat, посмотреть. Подправить вручную. Автоматически сделать все не получится, для синтеза базы всегда оптимизируются вручную - послушать, найти артефакт, проверить откуда он взялся (проверить место в оригинальной базе), подправить там, если нужно. Подправить транскрипцию, если там есть ошибка. Подправить словарь, если он не соответствует произношению диктора. Этот процесс уже описывался в данной теме ранее.<br>
<br>
Автоматическую разметку лучше делать с помощью sphinx или kaldi, ehmm на самом деле очень мутная штука.<br>
<br>
В фестивале последнем есть хороший метод оптимизации разметки - move_label, по идее он должен существенно улучшить качество сегментации. В этой теме он уже обсуждался ранее.<br>
<br>
По современным меркам база Elenа очень маленькая, я бы лучше занялся аудиокнигой, часов на 20-30 речи. С ней качество сегментации гораздо лучше.]]></description>
        <author>nsh</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3360997</guid>
        <pubDate>Thu, 03 Oct 2013 14:37:39 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3360997</link>
        <description><![CDATA[gsp: Здравствуйте. <br>
<br>
Попробовал натренировать базу RHVoice Elena для marytts. Пример - во [attach=#0]вложении[/attach]. Тип синтеза - unit selection. Действительно звук получился не такой металлический как в RHVoice, однако присутствуют многочисленные артефакты. Вроде бы, и сами фразы, и количество записей в базе совпадает с моделью Николая, но результат получился заметно хуже. Произношение не такое &quot;гладкое&quot;, огрехи синтеза выделяются резче. В связи с этим есть несколько вопросов знающим людям:<br>
<br>
1. Иногда при синтезе этим голосом в консоли сервера выводится предупреждение &quot;Warning: signal amplitude out of range: 32957&quot;. Стоит убавить громкость исходным файлам? Или проблема решается как-то по-другому?<br>
<br>
2. Имеет ли вообще смысл делать какую-либо предобработку исходного аудио? Выравнивание громкости, например? Есть ли какие-нибудь инструкции для подготовки аудио к тренировке?<br>
<br>
3. Перед тренировкой я перегнал исходные файлы из 44.1 КГЦ в 16. Имеет ли смысл пробовать перетренировать на 44.1 КГц? Теоретически при перегонке из-за некратных частот могли возникнуть какие-то артефакты в исходный файлах.<br>
<br>
4. Есть ли какие-нибудь способы проверить качество разметки (ehmm labeling)? Повысить это качество?]]></description>
        <author>gsp</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3349207</guid>
        <pubDate>Sun, 25 Aug 2013 05:26:45 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3349207</link>
        <description><![CDATA[uk8amk: Спасибо.<br>Попробую ковырнуть исходники.]]></description>
        <author>uk8amk</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3349191</guid>
        <pubDate>Sat, 24 Aug 2013 20:11:32 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3349191</link>
        <description><![CDATA[nsh: <div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>&quot;125&quot; - что это?</div></div><br>
<br>
Второе поле - тип метки. Есть разные метки - для слов, аллофонов, слогов, интонационных событий, и так далее. В разметке на аллофоны используется 125. <br>
<br>
Эти соглашения пошли из программы:<br>
<br>
<a class='tag-url' href='http://emu.sourceforge.net/' target='_blank'>http://emu.sourceforge.net/</a><br>
<br>
которая часто использовалась ранее для обработки речи.]]></description>
        <author>nsh</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3349140</guid>
        <pubDate>Sat, 24 Aug 2013 13:32:12 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3349140</link>
        <description><![CDATA[uk8amk: Интересует формат файлов *.LAB, тех что идут вместе с базой.<br>Гугл толком ничего не сказал.<br><br>Допустим начало файла ru_0001.lab:<br>0x23 0x0A <br>&quot;0.342000&quot; - ну это ясно что позиция метки<br>0x20<br>&quot;125&quot; - что это?<br>0x20<br>&quot;pay&quot; - имя метки<br>0x0A<br><br>Если в Wavesurfer вручную размечаю транскрипцию и сохраняю, то сохраняет без &quot;125&quot;.<br>В принципе пропарсить и так могу, но хотелось бы разобраться что да как.]]></description>
        <author>uk8amk</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3344161</guid>
        <pubDate>Thu, 08 Aug 2013 08:50:35 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3344161</link>
        <description><![CDATA[uk8amk: Здравствуйте уважаемые гуру синтеза.<br><br>Меня недавно заинтересовали технологии синтеза речи и я решил тоже сделать синтезатор на микроконтроллере.<br>За основу взял фонемную базу любительской программы Голос. Там около 680 фонем различной длины(столько влезло в 2МБ флешку).<br>Схема уже говорит. Но к сожалению есть проблемы. Фонемы записаны с различной громкостью и как признался автор в разных условиях. Я в редакторе подправляю косяки как могу. Но не все удается исправить.<br><br>Есть ли более качественные открытые и размеченные базы небольшого размера(5-10 мегабайт)?]]></description>
        <author>uk8amk</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3334198</guid>
        <pubDate>Wed, 10 Jul 2013 09:37:23 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3334198</link>
        <description><![CDATA[RaD: На x86 выгоднее пользоваться готовыми решениями. Коммерческими. Например, тот же cepstral даёт офигенное качество.]]></description>
        <author>RaD</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3333580</guid>
        <pubDate>Tue, 09 Jul 2013 06:13:35 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3333580</link>
        <description><![CDATA[zamir: Ну дык я рассуждаю так:<br>если ты уже синтез к микроконтроллерам прикручиваешь, то на x86 архитектуре синтез тобой уже реализован с достаточно приемлимом качеством =)<br>Я не прав?]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3333126</guid>
        <pubDate>Sun, 07 Jul 2013 08:59:45 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3333126</link>
        <description><![CDATA[RaD: Хаха, вот и зациклились, вы на меня, я на вас :)<br>
<br>
На самом деле МК STM32F10х освоены, сделал уже несколько девайсов разных, есть даже голосовой модуль, но пока на MP3. В планах забить в МК Flite, но пока даже примерно не знаю когда этим займусь.<br>
<br>
<img class='tag-img' src='http://img-fotki.yandex.ru/get/9300/4933204.13/0_a2a04_9752f5c6_XL.jpg' alt='user posted image'>]]></description>
        <author>RaD</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3309355</guid>
        <pubDate>Tue, 07 May 2013 11:17:09 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3309355</link>
        <description><![CDATA[zamir: <a class='tag-url' href='http://forum.sources.ru/index.php?showtopic=372427' target='_blank'>TTS для микроконтроллёров</a><br>
<br>
Думаю Руслан в этой теме сейчас лучше всего разбирается.<br>
Мне кажется начинать надо всё равно с громоздкого festvox]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3309345</guid>
        <pubDate>Tue, 07 May 2013 11:07:57 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3309345</link>
        <description><![CDATA[ivandevel: Здравствуйте&#33; Подскажите пожалуйста, как собрать русскую базу для синтезатора flite? Из чего ее вообще собирать? Интересует именно flite, т.к. очень компактен и работает сейчас на недорогом микроконтроллере.]]></description>
        <author>ivandevel</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3263156</guid>
        <pubDate>Sun, 20 Jan 2013 09:02:26 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3263156</link>
        <description><![CDATA[zamir: И так. Нашлось время на эксперимент.<br>
Сначала мне показалось что результат не такой уже впечатляющий, но я сравнил с <a class='tag-url' href='http://mary.dfki.de:59125/' target='_blank'>http://mary.dfki.de:59125/</a> - разница вполне ощутимая, хоть и не идеально конечно. (мне кажется нужно некоторое сглаживание - prosody modification?)<br>
<br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>Однажды, в студёную зимнюю пору, Я из лесу вышел; был сильный мороз. Гляжу, поднимается медленно в гору Лошадка, везущая хворосту воз. И, шествуя важно, в спокойствии чинном, Лошадку ведёт под уздцы мужичок. В больших сапогах, в полушубке овчинном, В больших рукавицах... а сам с ноготок&#33;</div></div><br>
результат синтеза: <a class='tag-url' href='http://z1.prolink.ru/sphinx/fest_demo_nekrasov.wav' target='_blank'>http://z1.prolink.ru/sphinx/fest_demo_nekrasov.wav</a><br>
<br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>Маленький мальчик нашёл пулемёт, больше в деревне никто не живёт.</div></div><br>
результат синтеза: <a class='tag-url' href='http://z1.prolink.ru/sphinx/fest_demo_tinyboy.wav' target='_blank'>http://z1.prolink.ru/sphinx/fest_demo_tinyboy.wav</a><br>
<br>
ударения проставлял в ручную<br>
<div class="tag-spoiler spoiler closed"><div class="spoiler_header" onclick="openCloseParent(this)">Скрытый текст</div><div class="body">М+аленький м+альчик наш+ёл пулем+ёт, б+ольше в дер+евне никт+о не жив+ёт.<br>
<br>
Одн+ажды, в студ+ёную з+имнюю п+ору, +Я +иЗ лесу в+ышел; б+ыл с+ильный мор+оз. Гляж+у, подним+ается м+едленно в г+ору Лош+адка, вез+ущая хв+оросту в+оз. +И, ш+ествуя в+ажно, в спок+ойствии ч+инном, Лош+адку вед+ёт под уздц+ы мужич+ок. В больш+их сапог+ах, в полуш+убке овч+инном, В больш+их рукав+ицах... а с+ам с ногот+ок&#33;</div></div><br>
<br>
как проставить ударение в <a class='tag-url' href='http://mary.dfki.de:59125/' target='_blank'>http://mary.dfki.de:59125/</a> - не разобрался. Николай, подскажите?<br>
<br>
Николай, поможете реализовать автопростановку ударения в festival ?]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3255278</guid>
        <pubDate>Wed, 26 Dec 2012 05:46:42 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3255278</link>
        <description><![CDATA[zamir: Если будет время соберу с текущим голосом более качественный синтез для festival<br>Только я вот точно не разберусь как этом языке (LISP?) сделать автоударение, поэтому ударение придётся вручную проставлять для синтеза (что многим не понравится)<br>Кто-нубудь сможет автоударение прикрутить?<br>festval может вызывать внешнюю програму для простановки ударения?]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3255243</guid>
        <pubDate>Tue, 25 Dec 2012 22:05:36 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3255243</link>
        <description><![CDATA[nsh: <div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>Каким образом достигается лучший результат? </div></div><br>
<br>
Собирается более полная база, реализуются более точные алгоритмы. В этом примере, кстати, openmary неправильно ударения ставит. С правильными ударениями результат будет гораздо лучше.<br>
<br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>Новый голос для openmary решит задачу?</div></div><br>
<br>
Конечно]]></description>
        <author>nsh</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3254992</guid>
        <pubDate>Tue, 25 Dec 2012 12:51:59 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3254992</link>
        <description><![CDATA[Dmitry Volen: <div class='tag-quote'><a class='tag-quote-link' href='https://forum.sources.ru/index.php?showtopic=204030&view=findpost&p=3249922'><span class='tag-quote-prefix'>Цитата</span></a> <span class='tag-quote__quote-info'>nsh &#064; <time class="tag-quote__quoted-time" datetime="2012-12-13T18:00:11+00:00">13.12.12, 18:00</time></span><div class='quote '>Какая проблема? Опишите проблему подробнее, опишите свои действия, что Вас беспокоит? Какой текст Вы пытаетесь синтезировать, что получается, что ожидается, что не нравится в результате.<br>
</div></div><br>
Синтезирую тестовую фразу &quot;Добро пожаловать в мир синтеза речи&#33;&quot;. Проверяю для openmary <a class='tag-url' href='http://mary.dfki.de:59125/' target='_blank'>http://mary.dfki.de:59125/</a>, проверяю для nuance <a class='tag-url' href='http://www.nuance.com/vocalizer5/flash/index.html' target='_blank'>http://www.nuance.com/vocalizer5/flash/index.html</a> . Во втором случае качество речи ощутимо лучше, более плавное и натуральное. Каким образом достигается лучший результат? Новый голос для openmary решит задачу?]]></description>
        <author>Dmitry Volen</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3249922</guid>
        <pubDate>Thu, 13 Dec 2012 18:00:11 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3249922</link>
        <description><![CDATA[nsh: <div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>Проблема в голосе? </div></div><br>
<br>
Какая проблема? Опишите проблему подробнее, опишите свои действия, что Вас беспокоит? Какой текст Вы пытаетесь синтезировать, что получается, что ожидается, что не нравится в результате.<br>
<br>
Любую проблему можно решить, нужно просто предоставить полную информацию.]]></description>
        <author>nsh</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3249836</guid>
        <pubDate>Thu, 13 Dec 2012 13:45:37 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3249836</link>
        <description><![CDATA[Dmitry Volen: <div class='tag-quote'><a class='tag-quote-link' href='https://forum.sources.ru/index.php?showtopic=204030&view=findpost&p=3249716'><span class='tag-quote-prefix'>Цитата</span></a> <span class='tag-quote__quote-info'>nsh &#064; <time class="tag-quote__quoted-time" datetime="2012-12-13T11:22:39+00:00">13.12.12, 11:22</time></span><div class='quote '>Известно, сделать голос для openmary из тех же данных:<br>
<a class='tag-url' href='https://github.com/marytts/marytts/wiki/New-Language-Support' target='_blank'>https://github.com/marytts/marytts/wiki/New-Language-Support</a></div></div><br>
На странице <a class='tag-url' href='http://mary.dfki.de:59125/' target='_blank'>http://mary.dfki.de:59125/</a> есть демо и для русского языка, но там звучание не отличается от festival. Проблема в голосе?]]></description>
        <author>Dmitry Volen</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3249716</guid>
        <pubDate>Thu, 13 Dec 2012 11:22:39 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3249716</link>
        <description><![CDATA[nsh: <div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>А известно, что нужно сделать, чтобы избавиться от &quot;металлического&quot; звука при синтезе? <br>
</div></div><br>
<br>
Известно, сделать голос для openmary из тех же данных:<br>
<br>
<a class='tag-url' href='https://github.com/marytts/marytts/wiki/New-Language-Support' target='_blank'>https://github.com/marytts/marytts/wiki/New-Language-Support</a><br>
<br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>Я бы мог заняться если наведете на задачи</div></div><br>
<br>
Займитесь]]></description>
        <author>nsh</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3249656</guid>
        <pubDate>Thu, 13 Dec 2012 10:09:27 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3249656</link>
        <description><![CDATA[Dmitry Volen: <div class='tag-quote'><a class='tag-quote-link' href='https://forum.sources.ru/index.php?showtopic=204030&view=findpost&p=3248193'><span class='tag-quote-prefix'>Цитата</span></a> <span class='tag-quote__quote-info'>nsh &#064; <time class="tag-quote__quoted-time" datetime="2012-12-11T08:40:31+00:00">11.12.12, 08:40</time></span><div class='quote '>Проект развивается семимильными шагами. </div></div><br>
А известно, что нужно сделать, чтобы избавиться от &quot;металлического&quot; звука при синтезе? Я бы мог заняться если наведете на задачи]]></description>
        <author>Dmitry Volen</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3248193</guid>
        <pubDate>Tue, 11 Dec 2012 08:40:31 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3248193</link>
        <description><![CDATA[nsh: Проект развивается семимильными шагами. Продолжение можно скачать тут:<br>
<br>
<a class='tag-url' href='https://github.com/Olga-Yakovleva/RHVoice' target='_blank'>https://github.com/Olga-Yakovleva/RHVoice</a><br>
<br>
Есть HTS голоса, драйвер для SAPI для Windows, улучшения ударений и много чего хорошего.<br>
<br>
Есть женский голос, исходную базу для него можно скачать тут:<br>
<br>
<a class='tag-url' href='http://tiflo.info/rhvoice/' target='_blank'>http://tiflo.info/rhvoice/</a>]]></description>
        <author>nsh</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3239118</guid>
        <pubDate>Mon, 19 Nov 2012 14:11:24 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=3239118</link>
        <description><![CDATA[Dmitry Volen: Подскажите, а для flite существуют русские голоса? Проект вообще еще развивается?]]></description>
        <author>Dmitry Volen</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2998258</guid>
        <pubDate>Sat, 01 Oct 2011 06:57:41 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2998258</link>
        <description><![CDATA[nsh: Пока не знаю, не думал над этим.]]></description>
        <author>nsh</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2998256</guid>
        <pubDate>Sat, 01 Oct 2011 06:53:08 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2998256</link>
        <description><![CDATA[zamir: <div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>Один из старейших хостингов открытых проектов Berlios (Berlin Open Source), пользующийся популярностью среди европейского сообщества разработчиков, объявил о скором закрытии. Инфраструктура проекта перестанет работать с 1 января 2012 года. </div></div><br>
<br>
Николай у вас там русский синтезатор лежит. Можете сообщить ссылку куда вы планируете его перезалить?]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2966048</guid>
        <pubDate>Fri, 19 Aug 2011 03:01:40 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2966048</link>
        <description><![CDATA[zamir: dict2transcript.pl не совсем то<br>
я похоже не залил эти скрипты<br>
сейчас залью <br>
<br>
<span class="tag-color tag-color-named" data-value="gray" style="color: gray"><span class='tag-size' data-value='7' style='font-size:7pt;'>Добавлено <time class="tag-mergetime" datetime="2011-08-19T03:08:40+00:00">19.08.11, 03:08</time></span></span><br>
залил<br>
<br>
accent_train.pl - обучение<br>
accent_test.pl - тестирование правильности расстановки ударения]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2965971</guid>
        <pubDate>Thu, 18 Aug 2011 18:50:00 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2965971</link>
        <description><![CDATA[GrandPeter: zamir:<br>здесь есть словарь из полутора миллиона слов с ударением<br>есть скрипт который с вероятностью 90% правильно высталяет ударение<br><br><br>скрипт с ударением это dict2transcript.pl в разделе &quot;Автоударение&quot;?<br><br>Да я так понимаю кто желает доработать голос в festival сталкиваются с тем, что там используется lisp и отсутствует русскоязычная литература(<br><br>Попробую переварить этот скрипт, если пойму вставлю в свою программку, если не возражаете.]]></description>
        <author>GrandPeter</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2965268</guid>
        <pubDate>Thu, 18 Aug 2011 06:44:51 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2965268</link>
        <description><![CDATA[zamir: <div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>если эти словари, о которых идет речь, конвертировать в словарь фестиваля, это не нарушит ни чьих авторских прав?</div></div><br>
то что выложено по ссылке в git не нарушает ничьи права<br>
если вы пропарсите то что выложил yandex на предмет ударения и никому об этом скажите это тоже не нарушит не чьи права<br>
мне кажется нет смысла заморачиваться с правами если есть желание что-то сделать и отдать безвозмездно<br>
как я уже писал пересинтезированный голос алёны для festival можно распространять через торренты и никто от этого не пострадает<br>
<br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>zamir Вы пробовали скрипт, который выставляет ударение в русском голосе для Festival?</div></div><br>
мой скрипт написан на perl. движёк фестиваля на lisp. я не знаю языка lisp.<br>
Всё что я смог сделать на этом языке выложено в этой теме чуть выше.<br>
посути это переработанный движёк nsh, в нём иная фонетическая база.<br>
поправьте если я ошибаюсь но Николай не выкладывал синтезатор который не использует wav файлы (живой голос) для синтеза, соответсенно я выложил имеено движёк который делает &quot;синтетический&quot; (другого слова не подобрал) синтез.<br>
Что называется преимущества в весе базы, недостатки слышны невооружённым ухом :)]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2965070</guid>
        <pubDate>Wed, 17 Aug 2011 19:21:30 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2965070</link>
        <description><![CDATA[GrandPeter: Если делать словарь, или программу, то такую чтобы потом никто не вязался по поводу авторского права. Поэтому я не рвусь конвертировать словари от лингво и т.п.<br><br>zamir и nsh: если эти словари, о которых идет речь, конвертировать в словарь фестиваля, это не нарушит ни чьих авторских прав?<br><br>zamir Вы пробовали скрипт, который выставляет ударение в русском голосе для Festival?<br><br>для nsh:<br>&quot;Я только не совсем понял, что мешает уважаемому GrandPeter этим заняться, нужно просто взять и сделать.&quot;<br><br>Я хочу сделать программу, которая позволит пользователю дополнять существующий словарь нужными им &quot;записями&quot; и делиться наработками с обществом. Создать словарь и пользоваться им одному в свое удовольствие мне не интересно. Возможно, когда удасться сделать часть задуманного и расписанного чуть выше, мне удасться дополнить словарь, и автоматом пользователи моего и совместимого с ним проекта получат эти наработки. <br><br>я несколько лет слежу за эволюцией msu_ru_nsh_clunits но отмечаю с сожалением, что она идет медленно, а то и вовсе в последний год остановилась. надеюсь я ошибаюсь.]]></description>
        <author>GrandPeter</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2964800</guid>
        <pubDate>Wed, 17 Aug 2011 13:42:18 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2964800</link>
        <description><![CDATA[nsh: Словарь нужно составлять, более того, словари уже есть хорошие, к той же Говорилке, можно их взять за основу.<br><br>http://1956.ru/speech2/index.html<br><br>да и к голосам под Windows словари тоже есть.<br><br>Я только не совсем понял, что мешает уважаемому GrandPeter этим заняться, нужно просто взять и сделать.]]></description>
        <author>nsh</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2964780</guid>
        <pubDate>Wed, 17 Aug 2011 13:31:18 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2964780</link>
        <description><![CDATA[zamir: звучание слова почти полностью зависит от ударного гласного<br>https://github.com/zamiron/ru4sphinx/tree/master/text2dict<br>здесь есть словарь из полутора миллиона слов с ударением<br>там же есть скрипт который с вероятностью 90% правильно высталяет ударение - вероятность можно увеличить, но я пока смысла в этом не вижу<br>если запарсить три миллиона слов в festival будет не очень весело<br>поэтому надо выделить оптимальные маски и проставлять ударение автоматически<br>в идеале можно научиться делать морфологический разбор слов, при таком разборе проще автоматически проставлять ударение<br>для этого что бы это сделать в festival надо уметь програмить на lisp (вроде этот язык там используется)<br>Есть некоторое колличество слов в которых ударение плавающее:<br>- возле окна&#39;<br>- о&#39;кна выходят во двор<br>поэтому некоторые ударения надо выставлять исходя из контекста предложения]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2964383</guid>
        <pubDate>Wed, 17 Aug 2011 09:12:36 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2964383</link>
        <description><![CDATA[GrandPeter: <div class='tag-quote'><a class='tag-quote-link' href='https://forum.sources.ru/index.php?showtopic=204030&view=findpost&p=2964342'><span class='tag-quote-prefix'>Цитата</span></a> <span class='tag-quote__quote-info'>nsh &#064; <time class="tag-quote__quoted-time" datetime="2011-08-17T08:31:10+00:00">17.08.11, 08:31</time></span><div class='quote '><div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>или каким-то образом можно указать фонетику:<br>
</div></div><br>
<br>
На данный момент нельзя, в списке задач такая задача есть:<br>
<br>
http://festlang.berlios.de/docu/doku.php?id=rustasks</div></div><br>
прочел список задач, есть пункт <br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>Дополнить словарь (уровень - простой)<br>
<br>
Необходимо переконвертировать парадигму Зализняка в словарь в формате dic/msu_ru_nsh.dict. А именно, для каждого слова получить часть речи и номер ударного слога. В конце организовать слова в нужный формат:<br>
<br>
(”слово” n 1)<br>
<br>
что значит, что “слово” это существительное и ударение падает на первый слог<br>
</div></div><br>
<br>
Я сделал программку которая на основе фестивал синтезирует из текста речь.<br>
http://sourceforge.net/projects/golos/<br>
есть еще один проект, уже более приспособлен к озвучке текстов<br>
http://sourceforge.net/projects/menestrel/<br>
<br>
На основе первой, можно организовать редактирования словаря. <br>
Раз в данный момент нет возможности записывать полную транскрипцию слова, то можно организовать добавление записи &quot;слово,часть речи и номер ударного слога&quot;.<br>
По большому счету, такая функция будет не особенно полезна, если не будет простой возможности делиться новыми &quot;записями&quot; словаря. <br>
Значит, надо организовать обмен такими записями, и их модерирование или добавление в словарь по рейтингу - т.е. <br>
например несколько человек прослушали звучание (учесть минимальное количество человек) согласно новой &quot;записи&quot; и оценили, <br>
например, по пятибальной шкале. Если какая - то запись удостаивается рейтинга в 5 звезд, она автоматически добавляется в словарь.  <br>
<br>
Серверную часть с рейтингом в одиночку пожалуй я не осилю. Однако можно попробовать воспользоваться svn-хранилищем (например на базе sourceforge.net). На базе svn будет удобно организовать синхронизацию основного словаря со словарями пользователей и таким образом его расширять.]]></description>
        <author>GrandPeter</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2964342</guid>
        <pubDate>Wed, 17 Aug 2011 08:31:10 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2964342</link>
        <description><![CDATA[nsh: <div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>или каким-то образом можно указать фонетику:<br>
</div></div><br>
<br>
На данный момент нельзя, в списке задач такая задача есть:<br>
<br>
http://festlang.berlios.de/docu/doku.php?id=rustasks]]></description>
        <author>nsh</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2964231</guid>
        <pubDate>Wed, 17 Aug 2011 06:21:16 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2964231</link>
        <description><![CDATA[GrandPeter: Здравствуйте nsh&#33;<br>Скажите пожалуйста, в файле <br>msu_ru_nsh_dict.scm<br>можно  только указать ударение и часть речи:<br>(&quot;докладах&quot; n (2))<br>или каким-то образом можно указать фонетику:<br>умножить v ( ((u) 0) ((m n o) 1) ((zh i tt) 0) )?]]></description>
        <author>GrandPeter</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2875187</guid>
        <pubDate>Wed, 13 Apr 2011 13:11:33 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2875187</link>
        <description><![CDATA[zamir: прикладываю результат своих трудов:<br>http://z1.prolink.ru/sphinx/msu_ru_nsh_cg.tar.gz<br><br>метки:<br>http://z1.prolink.ru/sphinx/labs.tar.gz<br><br>clunits у меня звучит не намного лучше чем у вас, поэтому не прикладываю (при желании модель быстро собирается с использованием меток)]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2860918</guid>
        <pubDate>Thu, 24 Mar 2011 13:29:41 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2860918</link>
        <description><![CDATA[nsh: <div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>вопряки указаниям я добавил в train модель фразы из тестового словаря</div></div><br>
<br>
Это не очень хорошо. Возможно, стоит взять тестовое множество поменьше, но отделить его от тренировочного. Например, начать с двух речевых отрезков.<br>
<br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>Думаю нет смысла пытаться улучшить модель если в английских диалектах MCD и того выше?</div></div><br>
<br>
Важно не абсолютное значение, а относительное. Улучшать дальше не стоит, разве что тестовое множество поменять на другое.]]></description>
        <author>nsh</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2860582</guid>
        <pubDate>Thu, 24 Mar 2011 07:16:17 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2860582</link>
        <description><![CDATA[zamir: вот тут MCD на английских диалектах около 5<br>
http://www.cs.cmu.edu/~awb/papers/icassp2009/0003785.pdf<br>
у меня около 4-х с половиной<br>
вопряки указаниям я добавил в train модель фразы из тестового словаря<br>
<div class='tag-code'><span class='pre_code'></span><div class='code  code_collapsed ' title='Подсветка синтаксиса доступна зарегистрированным участникам Форума.' style=''><div><div><ol type="1"><div class="code_line">Pass # #moves &nbsp;+ve &nbsp; -ve MCD &nbsp; &nbsp;std &nbsp; &nbsp; &nbsp;F0 &nbsp; &nbsp;std</div><div class="code_line">pass 0 &nbsp; &nbsp; 0 &nbsp; &nbsp; 0 &nbsp; &nbsp; 0 4.382 &nbsp;1.569 &nbsp;14.312 &nbsp;14.893</div><div class="code_line">pass 1 48860 24377 24483 4.416 &nbsp;1.607 &nbsp;14.088 &nbsp;13.486</div><div class="code_line">pass 2 28410 14498 13912 4.426 &nbsp;1.618 &nbsp;14.114 &nbsp;13.516</div><div class="code_line">pass 3 22343 11442 10901 4.443 &nbsp;1.643 &nbsp;14.154 &nbsp;13.554</div><div class="code_line">pass 4 19881 10173 &nbsp;9708 4.444 &nbsp;1.639 &nbsp;14.158 &nbsp;13.559</div><div class="code_line">pass 5 18485 &nbsp;9561 &nbsp;8924 4.457 &nbsp;1.667 &nbsp;14.199 &nbsp;13.601</div><div class="code_line">pass 6 17704 &nbsp;9061 &nbsp;8643 4.455 &nbsp;1.665 &nbsp;14.194 &nbsp;13.592</div><div class="code_line">pass 7 17178 &nbsp;8850 &nbsp;8328 4.464 &nbsp;1.680 &nbsp;14.222 &nbsp;13.611</div><div class="code_line">pass 8 16701 &nbsp;8568 &nbsp;8133 4.459 &nbsp;1.677 &nbsp;14.210 &nbsp;13.601</div><div class="code_line">pass 9 16385 &nbsp;8434 &nbsp;7951 4.468 &nbsp;1.696 &nbsp;14.232 &nbsp;13.617</div></ol></div></div></div></div><script>preloadCodeButtons('1');</script><br>
<br>
MCD только ростёт...<br>
Думаю нет смысла пытаться улучшить модель если в английских диалектах MCD и того выше?<br>
<br>
p.s. Если кто-то общается с разработчиками festvox скажите им что<br>
<div class='tag-code'><span class='pre_code'></span><div class='code  code_collapsed ' title='Подсветка синтаксиса доступна зарегистрированным участникам Форума.' style=''><div><div><ol type="1"><div class="code_line">do_move_label select</div></ol></div></div></div></div><br>
работает не корректно из за того что sort не умеет работать с плавающей запятой<br>
<div class='tag-code'><span class='pre_code'></span><div class='code  code_collapsed ' title='Подсветка синтаксиса доступна зарегистрированным участникам Форума.' style=''><div><div><ol type="1"><div class="code_line">bestpass=`sort --key=6 -n ml/summary | awk &#39;{if (NR==1) print }&#39;`</div></ol></div></div></div></div><br>
и сортировки по 6-му полю не будет]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2855798</guid>
        <pubDate>Thu, 17 Mar 2011 13:32:35 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2855798</link>
        <description><![CDATA[zamir: на сколько корректным будет работа move_label если я закоментирую выполнение ./bin/do_clustergen build_utts &#036;{PROMPTFILE} ?]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2855652</guid>
        <pubDate>Thu, 17 Mar 2011 12:10:02 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2855652</link>
        <description><![CDATA[zamir: возвращаю оригинальные метки<br>
запускаю<br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>./bin/do_clustergen build_utts &#036;{PROMPTFILE}<br>
./bin/do_clustergen f0 &#036;{PROMPTFILE}<br>
./bin/do_clustergen combine_coeffs_v &#036;{PROMPTFILE}<br>
./bin/do_clustergen cluster &#036;{PROMPTFILE}.train</div></div><br>
синтрезатор собрался<br>
запускаю<br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>/daemon/festival/speech_tools/../festival/bin/festival --heap 20000000 -b festvox/msu_ru_nsh_cg.scm /daemon/festival/festvox/src/clustergen/clustergen_build.scm &#39;(begin (voice_msu_ru_nsh_cg) (setq cg::generate_resynth_waves nil) (ClusterGen_test_resynth &quot;etc/txt.done.data.test&quot; &quot;test/cgp0&quot;))&#39;</div></div><br>
всё отработало корректно<br>
<br>
беру модель из папки ml/model1/* копирую в папку festival/trees/*<br>
запускаю<br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>/daemon/festival/speech_tools/../festival/bin/festival --heap 20000000 -b festvox/msu_ru_nsh_cg.scm /daemon/festival/festvox/src/clustergen/clustergen_build.scm &#39;(begin (voice_msu_ru_nsh_cg) (setq cg::generate_resynth_waves nil) (ClusterGen_test_resynth &quot;etc/txt.done.data.test&quot; &quot;test/cgp1&quot;))&#39;</div></div><br>
всё отработало корректно<br>
это подтвеждает что модели собираются рабочими<br>
после выполнения этой команды в папке test/cgp1 наконец-то появились mcep файлы<br>
запускаю &#036;FESTVOXDIR/src/clustergen/cg_test mcdf0 cgp1 &#036;{PROMPTFILE}.test &gt;ml/mcd.1 что бы проверить на верника<br>
ошибок нет <br>
<br>
<span class="tag-color tag-color-named" data-value="gray" style="color: gray"><span class='tag-size' data-value='7' style='font-size:7pt;'>Добавлено <time class="tag-mergetime" datetime="2011-03-17T12:37:38+00:00">17.03.11, 12:37</time></span></span><br>
беру метки lab1<br>
выполняю<br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>./bin/do_clustergen build_utts &#036;{PROMPTFILE}</div></div><br>
после этого модель не работает<br>
<br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>&#036;FESTVOXDIR/src/clustergen/cg_test mcdf0 cgp1 &#036;{PROMPTFILE}.test<br>
CG test_resynth ru_0010<br>
-=-=-=-=-=- EST Error -=-=-=-=-=-<br>
error:(class 1929) determinant &lt;= 0, det = 0.000000<br>
<br>
-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-<br>
</div></div><br>
<br>
файлы модели<br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>msu_ru_nsh_f0.tree       <br>
msu_ru_nsh_mcep.params   <br>
msu_ru_nsh_mcep.rawparams<br>
msu_ru_nsh_mcep.tree</div></div><br>
не изменились по дате<br>
изменились только файлы в папке festival/utts <br>
<br>
<span class="tag-color tag-color-named" data-value="gray" style="color: gray"><span class='tag-size' data-value='7' style='font-size:7pt;'>Добавлено <time class="tag-mergetime" datetime="2011-03-17T12:42:05+00:00">17.03.11, 12:42</time></span></span><br>
если убрать папку utts вознимат ошибка:<br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>CG test_resynth ru_0010<br>
Cannot open file festival/utts/ru_0010.utt as tokenstream<br>
load_utt: can&#39;t open utterance input file festival/utts/ru_0010.utt<br>
utt.load: loading from &quot;festival/utts/ru_0010.utt&quot; failed</div></div> <br>
<br>
<span class="tag-color tag-color-named" data-value="gray" style="color: gray"><span class='tag-size' data-value='7' style='font-size:7pt;'>Добавлено <time class="tag-mergetime" datetime="2011-03-17T12:45:50+00:00">17.03.11, 12:45</time></span></span><br>
возращаю метки lab0<br>
выполняю<br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>./bin/do_clustergen build_utts &#036;{PROMPTFILE}</div></div><br>
после этого &#036;FESTVOXDIR/src/clustergen/cg_test mcdf0 cgp1 &#036;{PROMPTFILE}.test ошибок не выдаёт]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2855221</guid>
        <pubDate>Thu, 17 Mar 2011 04:38:48 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2855221</link>
        <description><![CDATA[zamir: синтезатор работает даже после pass1<br>
в cg_resynth выставлен set -x<br>
и из логов видно что этот скрипт никогда не запускался<br>
<br>
как бычно pass0 прошёл<br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>60 unittypes as 15338 subunittypes dumped<br>
Tree models and vector params dumped<br>
Pass 0 find MCDs<br>
Pass # #moves  +ve   -ve MCD    std      F0    std<br>
pass 0     0     0     0 4.994  2.148  15.725  15.179<br>
Starting Pass 1<br>
Pass 1 moving labels</div></div><br>
<br>
начиная с pass1 ошибки<br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>160 unittypes as 15071 subunittypes dumped<br>
Tree models and vector params dumped<br>
Pass 1 find MCDs<br>
-=-=-=-=-=- EST Error -=-=-=-=-=-<br>
error:(class 1929) determinant &lt;= 0, det = 0.000000<br>
<br>
-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-<br>
Error reading ESPS file test/cgp1/ru_0010.mcep</div></div>]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2854968</guid>
        <pubDate>Wed, 16 Mar 2011 17:55:56 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2854968</link>
        <description><![CDATA[zamir: собралась модель<br>
прикладываю пример синтеза фразы из словаря<br>
тоесть после сборки модели - синтерзатор работает<br>
<br>
теперь запускаю move_label...<br>
<br>
<span class="b-attach" data-size="191607" data-hits="465" data-attach-id="8033" data-attach-post-id="2854968">
			<span class="b-attach__title"></span><a class='b-attach-link' href='https://forum.sources.ru/index.php?act=Attach&amp;type=post&amp;id=2854968&amp;attach_id=8033' title='Скачать файл' target='_blank'>cg_ru_0037_2.wav.zip</a> (, : 465)
		</span>]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2854695</guid>
        <pubDate>Wed, 16 Mar 2011 13:30:12 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2854695</link>
        <description><![CDATA[zamir: если перед pau в postlex удалить фонему, то получится последовательность &quot;0 pau&quot; которая приводит к ошибке Int Target General: targets out of order<br><br>после исправления этой ошибки (путём замены фонемы на pau вместо её удаления :( ), запуск:<br>&#036;FESTVOXDIR/src/clustergen/cg_test mcdf0 cgp0 &#036;{PROMPTFILE}.test &gt;ml/mcd.0 <br>всё равно заканчивается тойже ошибкой что и раньше, так что не в этом наверное проблема<br>пересобираю всё поновой...<br>но так как и с таким косячком pass0 проходил нормально, думаю проблема не в этом...]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2854470</guid>
        <pubDate>Wed, 16 Mar 2011 11:32:21 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2854470</link>
        <description><![CDATA[zamir: сам по себе голос после первоначальной сборки работает<br>
после двиганья меток - не работает<br>
я пробовал убрать строку &quot;(setq cg::generate_resynth_waves nil)&quot; - ошибка таже самая<br>
я прервал передвижение меток и запустил:<br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>&#036;FESTVOXDIR/src/clustergen/cg_test mcdf0 cgp0 &#036;{PROMPTFILE}.test &gt;ml/mcd.0</div></div><br>
ошибка также самая, несмотря на то, что ранее (сразу после сборки модели) этот шаг отрабатывал коректно:<br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>160 unittypes as 15338 subunittypes dumped<br>
Tree models and vector params dumped<br>
Pass 0 find MCDs<br>
Pass # #moves  +ve   -ve MCD    std      F0    std<br>
pass 0     0     0     0 4.631  1.914  13.984  13.619<br>
Starting Pass 1<br>
Pass 1 moving labels</div></div><br>
<br>
после этого я перезапустил ./bin/do_clustergen move_label<br>
и заметил что теперь ошибка вылезат на нулевом этапе<br>
<br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>160 unittypes as 15132 subunittypes dumped<br>
Tree models and vector params dumped<br>
Pass 0 find MCDs<br>
+ /daemon/festival/speech_tools/../festival/bin/festival --heap 20000000 -b festvox/msu_ru_nsh_cg.scm /daemon/festival/festvox/src/clustergen/clustergen_build.scm &#39;(begin (voice_msu_ru_nsh_cg) (setq cg::generate_resynth_waves nil) (ClusterGen_test_resynth &quot;etc/txt.done.data.test&quot; &quot;test/cgp0&quot;))&#39;<br>
-=-=-=-=-=- EST Error -=-=-=-=-=-<br>
error:(class 1929) determinant &lt;= 0, det = 0.000000<br>
<br>
-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-<br>
+ exit 0</div></div> <br>
<br>
<span class="tag-color tag-color-named" data-value="gray" style="color: gray"><span class='tag-size' data-value='7' style='font-size:7pt;'>Добавлено <time class="tag-mergetime" datetime="2011-03-16T12:04:03+00:00">16.03.11, 12:04</time></span></span><br>
извиняюсь<br>
это какой-то мой косяк<br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '># echo &quot;В рук+е +он держ+ал кон+ец&quot; | text2wave -eval &#39;(voice_msu_ru_nsh_cg)&#39; &gt; cg_test1.wav</div></div><br>
<br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '># echo &quot;В рук+е +он держ+ал -- кон+ец&quot; | text2wave -eval &#39;(voice_msu_ru_nsh_cg)&#39; &gt; cg_test1.wav<br>
Int Target General: targets out of order</div></div><br>
<br>
пытаюсь разобраться]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2854448</guid>
        <pubDate>Wed, 16 Mar 2011 11:07:31 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2854448</link>
        <description><![CDATA[nsh: cg::generate_resynth_waves в свою очередь вызывает команду cg_resynth, нужно посмотреть, что на входе этой команды, что на выходе:<br>
<br>
<div class='tag-code'><span class='pre_code'></span><div class='code  code_collapsed ' title='Подсветка синтаксиса доступна зарегистрированным участникам Форума.' style=''><div><div><ol type="1"><div class="code_line">(define (cg_wave_synth_external utt)</div><div class="code_line">&nbsp;&nbsp;;; before we had it built-in to Festival</div><div class="code_line">&nbsp;&nbsp;(let ((trackname (make_tmp_filename))</div><div class="code_line">&nbsp;&nbsp; &nbsp; &nbsp; &nbsp;(wavename (make_tmp_filename))</div><div class="code_line">&nbsp;&nbsp; &nbsp; &nbsp; &nbsp;)</div><div class="code_line">&nbsp;&nbsp; &nbsp;(track.save (utt.feat utt &quot;param_track&quot;) trackname &quot;est&quot;)</div><div class="code_line">&nbsp;&nbsp; &nbsp;(system</div><div class="code_line">&nbsp;&nbsp; &nbsp; (format nil &quot;$FESTVOXDIR/src/clustergen/cg_resynth %s %s&quot;</div></ol></div></div></div></div> <br>
<br>
<span class="tag-color tag-color-named" data-value="gray" style="color: gray"><span class='tag-size' data-value='7' style='font-size:7pt;'>Добавлено <time class="tag-mergetime" datetime="2011-03-16T11:10:15+00:00">16.03.11, 11:10</time></span></span><br>
Сам по себе голос-то работает? Если он тестовые записи синтезировать не может, может там что-то не так?]]></description>
        <author>nsh</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2854099</guid>
        <pubDate>Wed, 16 Mar 2011 04:32:27 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2854099</link>
        <description><![CDATA[zamir: <div class='tag-quote'><a class='tag-quote-link' href='https://forum.sources.ru/index.php?showtopic=204030&view=findpost&p=2851609'><span class='tag-quote-prefix'>Цитата</span></a> <span class='tag-quote__quote-info'>nsh &#064; <time class="tag-quote__quoted-time" datetime="2011-03-12T10:44:22+00:00">12.03.11, 10:44</time></span><div class='quote '>Дальше надо в cg_test добавить &quot;set -x&quot; чтобы видеть вызываемые команды. Найти команду, которая завершается неудачей.</div></div><br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>+ /daemon/festival/speech_tools/../festival/bin/festival --heap 20000000 -b festvox/msu_ru_nsh_cg.scm /daemon/festival/festvox/src/clustergen/clustergen_build.scm &#39;(begin (voice_msu_ru_nsh_cg) (setq cg::generate_resynth_waves nil) (ClusterGen_test_resynth &quot;etc/txt.done.data.test&quot; &quot;test/cgp1&quot;))&#39;<br>
-=-=-=-=-=- EST Error -=-=-=-=-=-<br>
error:(class 1929) determinant &lt;= 0, det = 0.000000<br>
<br>
-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-<br>
</div></div>]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2852582</guid>
        <pubDate>Mon, 14 Mar 2011 07:31:06 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2852582</link>
        <description><![CDATA[zamir: Вроде разобрался немного...]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2852360</guid>
        <pubDate>Sun, 13 Mar 2011 18:59:05 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2852360</link>
        <description><![CDATA[nsh: <div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>в postlex я ничего понять не могу</div></div><br>
<br>
Если что-то непонятно, всегда можно спросить. На стадии postlex описываются преобразования последовательностей звуков после соединения слов в предложения. На стадии lts - звуки внутри слова.<br>
По Scheme можно найти какое-нибудь простое введение, это не сложнее, чем perl.]]></description>
        <author>nsh</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2852309</guid>
        <pubDate>Sun, 13 Mar 2011 17:48:26 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2852309</link>
        <description><![CDATA[zamir: <div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>на стадии postlex надо двойную k просто убирать </div></div><br>
<br>
в postlex я ничего понять не могу<br>
а в LTS оказывается мои правила не работают...<br>
<br>
    ( # [ к ] # * к = )<br>
<br>
и остальные тоже значит...<br>
<br>
;; SURD также включает конец слова - #<br>
    ( [ б ] # * SURD = p )<br>
    ( [ в ] # * SURD = f )<br>
    ( [ г ] # * SURD = k )<br>
    ( [ д ] # * SURD = t )<br>
    ( [ з ] # * SURD = s )<br>
    ( [ ж ] # * SURD = sh )<br>
    ( [ б ] ь SURD = pp )<br>
    ( [ в ] ь SURD = ff )<br>
    ( [ г ] ь SURD = kk )<br>
    ( [ д ] ь SURD = tt )<br>
    ( [ з ] ь SURD = ss )<br>
    ( [ п ] # * RINGING = b )<br>
    ( [ ф ] # * RINGING = v )<br>
    ( [ к ] # * RINGING = g )<br>
    ( [ т ] # * RINGING = d )<br>
    ( [ ш ] # * RINGING = zh )<br>
    ( [ с ] # * RINGING = z )<br>
<br>
жаль..]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2851609</guid>
        <pubDate>Sat, 12 Mar 2011 10:44:22 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2851609</link>
        <description><![CDATA[nsh: Ну do_move_label вызывает cg_test. Дальше надо в cg_test добавить &quot;set -x&quot; чтобы видеть вызываемые команды. <br>Найти команду, которая завершается неудачей. <br><br>Видимо, festival не может синтезировать какое-то предложение из тестовых. Что-то в голосе было накручено.<br>Возможно, можно будет убрать одно из тестовых предложений.]]></description>
        <author>nsh</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2851504</guid>
        <pubDate>Sat, 12 Mar 2011 05:36:34 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2851504</link>
        <description><![CDATA[zamir: Ситуация немного улучшилась, но ошибки прослеживаются (начиная с pass 1), но куда капать теперь у меня даже предположений нет<br>
<br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>stival/disttabs/pau_2.mcep&#39; -stop 50 -output &#39;festival/trees/pau_2_mcep.tree&#39;<br>
Clustergen mcep tree build on: pau_3<br>
&#036;ESTDIR/bin/wagon  -track_start 1 -heap 10000000 -vertex_output mean -desc festival/clunits/mcep.desc -data &#39;festival/feats/pau_3.feats&#39; -test &#39;festival/feats/pau_3.feats&#39; -balance 0 -track &#39;fe<br>
stival/disttabs/pau_3.mcep&#39; -stop 50 -output &#39;festival/trees/pau_3_mcep.tree&#39;<br>
160 unittypes as 14968 subunittypes dumped<br>
Tree models and vector params dumped<br>
Pass 5 find MCDs<br>
-=-=-=-=-=- EST Error -=-=-=-=-=-<br>
error:(class 1929) determinant &lt;= 0, det = 0.000000<br>
<br>
-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-<br>
Error reading ESPS file test/cgp5/ru_0010.mcep<br>
Error reading ESPS file test/cgp5/ru_0010.mcep<br>
/daemon/festival/festvox/src/clustergen/track_diff_f0: line 89: [: 26: unary operator expected<br>
/daemon/festival/festvox/src/clustergen/track_diff_f0: line 95: [: 1958: unary operator expected<br>
</div></div>]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2850799</guid>
        <pubDate>Fri, 11 Mar 2011 09:25:46 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2850799</link>
        <description><![CDATA[nsh: Так дам действительно должна быть только одна k. <br><br>Видимо, надо на стадии postlex надо двойную k просто убирать и пересобрать всё.]]></description>
        <author>nsh</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2850758</guid>
        <pubDate>Fri, 11 Mar 2011 08:54:29 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2850758</link>
        <description><![CDATA[zamir: я думал...<br>появляется только в фонеме k<br>в mcep файлах nan не обнаружен<br>выше я написал что есть последовательности &quot;к кот+орой&quot;, &quot;к к+уполу&quot; в которых &quot;к к&quot; может являться одной фонемой, хотя транскриптор выводит две фонемы, но прикол в том что ни одно из этих предложений не явилось причиной почему я не мог создать кластер синтез<br>что бы думать глубже или правильнее у меня не хватает знаний и опыта.<br>а сбор этого добра занимает много времени... у меня уже один диск вышел из строя (хорошо ещё что softraid настроен) пока я этими многочисленными сборками занимаюсь...]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2850739</guid>
        <pubDate>Fri, 11 Mar 2011 08:38:18 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2850739</link>
        <description><![CDATA[nsh: Видимо настало время подумать, почему появляется nan.]]></description>
        <author>nsh</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2850577</guid>
        <pubDate>Fri, 11 Mar 2011 04:28:18 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2850577</link>
        <description><![CDATA[zamir: это трындец...<br>нашёл файл из-за которого вылезал nan методом перебора - удалил его<br>разбивил файлы при помощи traintest<br>при запуске move_label модель не собирается<br>переразбил - первая модель собралась, но при перемещении меток снова возникает nan и модель не собирается...]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2846588</guid>
        <pubDate>Sat, 05 Mar 2011 18:38:34 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2846588</link>
        <description><![CDATA[nsh: С помощью скрипта traintest нужно разбить файл базы etc/txt.done.data на две части - etc/txt.done.data.train и etc/txt.done.data.test. На первой части голос будет тренироваться, на второй тестироваться.]]></description>
        <author>nsh</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2846576</guid>
        <pubDate>Sat, 05 Mar 2011 18:09:01 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2846576</link>
        <description><![CDATA[zamir: move_label пыхтит, вроде даже что-то понемногу двигается, но на каждом этапе в логах появляются ошибки<br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '><br>
IOD ERROR: could not open file etc/txt.done.data.train<br>
Pass 10 find MCDs<br>
SIOD ERROR: could not open file etc/txt.done.data.test<br>
cat: etc/txt.done.data.test: Нет такого файла или каталога<br>
awk: cmd. line:1: fatal: division by zero attempted<br>
cat: etc/txt.done.data.test: Нет такого файла или каталога<br>
awk: cmd. line:1: fatal: division by zero attempted</div></div><br>
<br>
из которых можно предположить что для работы этого алгоритма надо что-то ещё...<br>
не просветите по этому вопросу?]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2846155</guid>
        <pubDate>Sat, 05 Mar 2011 06:55:04 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2846155</link>
        <description><![CDATA[zamir: удалил ./mcep/*.mcep начиная с 500<br>
собралось<br>
голос через чур дрожащим получился<br>
ещё пока разирался нашёл вот такие проблемные места у себя из-за выравнивания материала при помощи sphinx<br>
# cat ./txt.done.data.save |grep &#39; к -- &#39;<br>
( ru_0455 &quot;-- з+а воскр+есной -- литург+ией -- он+а подним+ала глаз+а ат мол+итвенника -- +и м+еж с+изых клуб+ов л+адана -- вознос+ившихся <strong class='tag-b'>к -- к</strong>+уполу -- в+идела кр+откий л+ик -- д+евы мар+ии&quot; )<br>
( ru_0684 &quot;к+ак пробуд+ились вн+овь люб+овь -- над+ежды -- +и мол+итва В груд+и -- <strong class='tag-b'>к -- к</strong>от+орой приж+ался мал+ютка&quot; )<br>
<br>
это могло повлиять?<br>
без файла ru_0684 я пересобирать пробовал - результат тот же<br>
с файлом  ru_0455 оно сейчас собралось<br>
<br>
<span class="b-attach" data-size="129727" data-hits="436" data-attach-id="7727" data-attach-post-id="2846155">
			<span class="b-attach__title"></span><a class='b-attach-link' href='https://forum.sources.ru/index.php?act=Attach&amp;type=post&amp;id=2846155&amp;attach_id=7727' title='Скачать файл' target='_blank'>cg_test.rar</a> (, : 436)
		</span>]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2844877</guid>
        <pubDate>Thu, 03 Mar 2011 19:50:01 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2844877</link>
        <description><![CDATA[zamir: регулярными выражениями проверил что везде только цифры, каких либо левых символов нет]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2844371</guid>
        <pubDate>Thu, 03 Mar 2011 13:36:35 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2844371</link>
        <description><![CDATA[zamir: Нигде nan не обнаружил<br><br># ch_track ./mcep/*.mcep |grep -i na<br># ch_track ./mcep_deltas/*.mcep |grep -i na<br># ch_track ./ccoefs/*.mcep |grep -i na<br># ch_track ./festival/disttabs/*.mcep |grep -i na<br><br> :wall: <br><br>значений -0.00000 и 0.00000 в файлах полно<br><br>((((111.878 -nan) (0.984285 0.426654) (1.32527 0.18907) (-0.289974 0.173128)<br><br>пробовал искать в ./mcep/*.mcep значения 111.878 0.984285 - не нашёл<br><br>запускаю<br><br>./bin/do_clustergen cluster                     1&gt;./10_cluster.log 2&gt;&amp;1<br><br>полный лог<br><br>http://z1.prolink.ru/sphinx/10_cluster.log<br><br>у вас есть ещё идеи?  :)]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2843830</guid>
        <pubDate>Thu, 03 Mar 2011 07:33:05 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2843830</link>
        <description><![CDATA[nsh: Для clustergen нужна разметка уровня состояний HMM, а не уровня аллофонов. Разметка от sphinx3 не подойдёт, только ehmm.]]></description>
        <author>nsh</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2843782</guid>
        <pubDate>Thu, 03 Mar 2011 04:23:38 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2843782</link>
        <description><![CDATA[zamir: [mcep]# ch_track *.mcep |grep -i nan<br>
[mcep_deltas]# ch_track *.mcep |grep -i nan<br>
после сборки с метками sphinx таких файлов нет<br>
но требуются файлы lab/ru_0006.sl которые sphinx не создаёт<br>
<br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>ru_0001 Processing<br>
Cannot open file lab/ru_0001.sl as tokenstream<br>
load_relation: can&#39;t open relation input file lab/ru_0001.sl<br>
utt.load.relation: loading from &quot;lab/ru_0001.sl&quot; failed</div></div><br>
<br>
пробую дальше...]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2843675</guid>
        <pubDate>Wed, 02 Mar 2011 19:24:35 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2843675</link>
        <description><![CDATA[nsh: <div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>я понимаю, но все остальные mcep файлы бинарные...<br>
</div></div><br>
<br>
В файлах mcep лежат числа. Перевести их в текстовую форму можно с помощью ch_track из speech_tools.]]></description>
        <author>nsh</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2843667</guid>
        <pubDate>Wed, 02 Mar 2011 19:14:14 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2843667</link>
        <description><![CDATA[zamir: я понимаю, но все остальные mcep файлы бинарные...<br>
ищу в файлах *mcep* последовательность nan<br>
<br>
нашёл следующее:<br>
находится последовательность в *.mcep в папках mcep_deltas и mcep<br>
большей частью это бинарный файл <br>
<br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>.nan&gt;..).p<br>
[.e.NaN=...<br>
.*&lt;nan..pU<br>
K...NaN..<br>
..U.NAn...<br>
.=.l.&lt;naN...`=<br>
.^Z&gt;nAN..dw<br>
^E.&#092;.^T=nAn.=XY<br>
^W8&gt;nAN..j<br>
...&#1563;=nan=.^^<br>
=..мNAn=.|&lt;=<br>
P..nAn??um<br>
...NaN&gt;&#1687;.<br>
.^G^&gt;NAN=M.^@<br>
...naN.,|b=<br>
=#^.;nAN&lt;*.@<br>
./.&lt;NAN=.P.<br>
;. &#1432;.nan.9C..<br>
=^U.&#092;=naN&lt;<br>
D.nAn..*<br>
.;Nan.U^<br>
..U&gt;Nan=t..<br>
|..&lt;nan=.^U<br>
¶^B.nan.E<br>
^[&gt;nAn.<br>
T..&gt;NaN.</div></div><br>
<br>
<br>
это больше похоже на случайность...<br>
с какой последовательностью стоит удалить файл?<br>
<br>
p.s. взял метки sphinx - пересобираю всё по новой, завтра скажу собралось или нет.]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2843658</guid>
        <pubDate>Wed, 02 Mar 2011 18:56:02 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2843658</link>
        <description><![CDATA[nsh: <div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>нашёл nan в festival/trees/k_1_mcep.tree (встречается в одном файле один раз)<br>
</div></div><br>
<br>
Nan нужно искать внутри mcep файлов, а не в деревьях. В деревьях они как следствие. После того, как nan найден проще всего проблемный файл из базы выкинуть, удалив из etc/txt.done.data]]></description>
        <author>nsh</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2843611</guid>
        <pubDate>Wed, 02 Mar 2011 17:33:38 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2843611</link>
        <description><![CDATA[zamir: не выходит...   :( <br>
<br>
<div class='tag-code'><span class='pre_code'></span><div class='code  code_collapsed ' title='Подсветка синтаксиса доступна зарегистрированным участникам Форума.' style=''><div><div><ol type="1"><div class="code_line">Dataset of 8292 vectors of 62 parameters from: festival/feats/pau_2.feats</div><div class="code_line">RMSE 0.1207 Correlation is 0.9661 Mean (abs) Error 0.0769 (0.0930)</div><div class="code_line">Dataset of 17248 vectors of 62 parameters from: festival/feats/pau_3.feats</div><div class="code_line">Dataset of 17248 vectors of 62 parameters from: festival/feats/pau_3.feats</div><div class="code_line">RMSE 0.2080 Correlation is 0.8451 Mean (abs) Error 0.0862 (0.1893)</div><div class="code_line">SIOD ERROR: not a number : -nan</div><div class="code_line">R/bin/wagon &nbsp;-track_start 1 -heap 10000000 -vertex_output mean -desc festival/clunits/mcep.desc -data &#39;festival/feats/aa_1.feats&#39; -test &#39;festival/feats/aa_1.feats&#39; -balance 0 -track &#39;festival/disttabs/aa_1.mcep&#39; -stop 50 -output &#39;festiva</div><div class="code_line">l/trees/aa_1_mcep.tree&#39;</div><div class="code_line">Clustergen mcep tree build on: aa_2</div><div class="code_line">$ESTDIR/bin/wagon &nbsp;-track_start 1 -heap 10000000 -vertex_output mean -desc festival/clunits/mcep.desc -data &#39;festival/feats/aa_2.feats&#39; -test &#39;festival/feats/aa_2.feats&#39; -balance 0 -track &#39;festival/disttabs/aa_2.mcep&#39; -stop 50 -output &#39;f</div><div class="code_line">estival/trees/aa_2_mcep.tree&#39;</div><div class="code_line">Clustergen mcep tree build on: aa_3</div><div class="code_line">$ESTDIR/bin/wagon &nbsp;-track_start 1 -heap 10000000 -vertex_output mean -desc festival/clunits/mcep.desc -data &#39;festival/feats/aa_3.feats&#39; -test &#39;festival/feats/aa_3.feats&#39; -balance 0 -track &#39;festival/disttabs/aa_3.mcep&#39; -stop 50 -output &#39;f</div><div class="code_line">estival/trees/aa_3_mcep.tree&#39;</div><div class="code_line">Clustergen mcep tree build on: mm_1</div><div class="code_line">$ESTDIR/bin/wagon &nbsp;-track_start 1 -heap 10000000 -vertex_output mean -desc festival/clunits/mcep.desc -data &#39;festival/feats/mm_1.feats&#39; -test &#39;festival/feats/mm_1.feats&#39; -balance 0 -track &#39;festival/disttabs/mm_1.mcep&#39; -stop 50 -output &#39;f</div><div class="code_line">estival/trees/mm_1_mcep.tree&#39;</div><div class="code_line">Clustergen mcep tree build on: mm_2</div><div class="code_line">$ESTDIR/bin/wagon &nbsp;-track_start 1 -heap 10000000 -vertex_output mean -desc festival/clunits/mcep.desc -data &#39;festival/feats/mm_2.feats&#39; -test &#39;festival/feats/mm_2.feats&#39; -balance 0 -track &#39;festival/disttabs/mm_2.mcep&#39; -stop 50 -output &#39;f</div><div class="code_line">estival/trees/mm_2_mcep.tree&#39;</div><div class="code_line">Clustergen mcep tree build on: mm_3</div><div class="code_line">$ESTDIR/bin/wagon &nbsp;-track_start 1 -heap 10000000 -vertex_output mean -desc festival/clunits/mcep.desc -data &#39;festival/feats/mm_3.feats&#39; -test &#39;festival/feats/mm_3.feats&#39; -balance 0 -track &#39;festival/disttabs/mm_3.mcep&#39; -stop 50 -output &#39;f</div><div class="code_line">estival/trees/mm_3_mcep.tree&#39;</div><div class="code_line">Clustergen mcep tree build on: i_1</div><div class="code_line">$ESTDIR/bin/wagon &nbsp;-track_start 1 -heap 10000000 -vertex_output mean -desc festival/clunits/mcep.desc -data &#39;festival/feats/i_1.feats&#39; -test &#39;festival/feats/i_1.feats&#39; -balance 0 -track &#39;festival/disttabs/i_1.mcep&#39; -stop 50 -output &#39;fest</div><div class="code_line">ival/trees/i_1_mcep.tree&#39;</div><div class="code_line">Clustergen mcep tree build on: i_2</div><div class="code_line">$ESTDIR/bin/wagon &nbsp;-track_start 1 -heap 10000000 -vertex_output mean -desc festival/clunits/mcep.desc -data &#39;festival/feats/i_2.feats&#39; -test &#39;festival/feats/i_2.feats&#39; -balance 0 -track &#39;festival/disttabs/i_2.mcep&#39; -stop 50 -output &#39;fest</div><div class="code_line">ival/trees/i_2_mcep.tree&#39;</div><div class="code_line">Clustergen mcep tree build on: i_3</div><div class="code_line">$ESTDIR/bin/wagon &nbsp;-track_start 1 -heap 10000000 -vertex_output mean -desc festival/clunits/mcep.desc -data &#39;festival/feats/i_3.feats&#39; -test &#39;festival/feats/i_3.feats&#39; -balance 0 -track &#39;festival/disttabs/i_3.mcep&#39; -stop 50 -output &#39;fest</div><div class="code_line">ival/trees/i_3_mcep.tree&#39;</div><div class="code_line">Clustergen mcep tree build on: pau_1</div><div class="code_line">$ESTDIR/bin/wagon &nbsp;-track_start 1 -heap 10000000 -vertex_output mean -desc festival/clunits/mcep.desc -data &#39;festival/feats/pau_1.feats&#39; -test &#39;festival/feats/pau_1.feats&#39; -balance 0 -track &#39;festival/disttabs/pau_1.mcep&#39; -stop 50 -output</div><div class="code_line">&nbsp;&#39;festival/trees/pau_1_mcep.tree&#39;</div><div class="code_line">Clustergen mcep tree build on: pau_2</div><div class="code_line">$ESTDIR/bin/wagon &nbsp;-track_start 1 -heap 10000000 -vertex_output mean -desc festival/clunits/mcep.desc -data &#39;festival/feats/pau_2.feats&#39; -test &#39;festival/feats/pau_2.feats&#39; -balance 0 -track &#39;festival/disttabs/pau_2.mcep&#39; -stop 50 -output</div><div class="code_line">&nbsp;&#39;festival/trees/pau_2_mcep.tree&#39;</div><div class="code_line">Clustergen mcep tree build on: pau_3</div><div class="code_line">$ESTDIR/bin/wagon &nbsp;-track_start 1 -heap 10000000 -vertex_output mean -desc festival/clunits/mcep.desc -data &#39;festival/feats/pau_3.feats&#39; -test &#39;festival/feats/pau_3.feats&#39; -balance 0 -track &#39;festival/disttabs/pau_3.mcep&#39; -stop 50 -output</div><div class="code_line">&nbsp;&#39;festival/trees/pau_3_mcep.tree&#39;</div><div class="code_line">BACKTRACE:</div><div class="code_line">&nbsp;&nbsp; 0: (f (car l2))</div><div class="code_line">&nbsp;&nbsp; 1: (cons (f (car l2)) r)</div><div class="code_line">&nbsp;&nbsp; 2: (set! r (cons (f (car l2)) r))</div><div class="code_line">&nbsp;&nbsp; 3: (while l2 (set! r (cons (f (car l2)) r)) (set! l2 (cdr l2)))</div><div class="code_line">&nbsp;&nbsp; 4: (mapcar</div><div class="code_line">&nbsp;&nbsp; &nbsp;(lambda</div><div class="code_line">&nbsp;&nbsp; &nbsp; (x)</div><div class="code_line">&nbsp;&nbsp; &nbsp; (...))</div><div class="code_line">&nbsp;&nbsp; &nbsp;(caar tree))</div><div class="code_line">&nbsp;&nbsp; 5: (clustergen::dump_tree_vectors (car (cdr (cdr tree))) rawtrackfd)</div><div class="code_line">&nbsp;&nbsp; 6: (clustergen::dump_tree_vectors (car (cdr tree)) rawtrackfd)</div><div class="code_line">&nbsp;&nbsp; 7: (clustergen::dump_tree_vectors (car (cdr tree)) rawtrackfd)</div><div class="code_line">&nbsp;&nbsp; 8: (clustergen::dump_tree_vectors (car (cdr (cdr tree))) closing a file left open: festival/trees/msu_ru_nsh_mcep.rawparams</div><div class="code_line">closing a file left open: festival/trees/msu_ru_nsh_mcep.tree</div><div class="code_line">rawtrackfd)</div><div class="code_line">&nbsp;&nbsp; 9: (clustergen::dump_tree_vectors (car (cdr (cdr tree))) rawtrackfd)</div><div class="code_line">&nbsp;&nbsp;10: (clustergen::dump_tree_vectors (car (cdr (cdr tree))) rawtrackfd)</div></ol></div></div></div></div>]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2843158</guid>
        <pubDate>Wed, 02 Mar 2011 09:58:31 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2843158</link>
        <description><![CDATA[zamir: нашёл nan в festival/trees/k_1_mcep.tree (встречается в одном файле один раз)<br><br>как исправить? <br><br>./bin/make_pm_fix pm/*.pm <br>а затем<br>./bin/do_clustergen mcep<br><br>?]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2843139</guid>
        <pubDate>Wed, 02 Mar 2011 09:34:08 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2843139</link>
        <description><![CDATA[nsh: Кучу надо прямо к вагону добавлять:<br>
<br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>&#036;ESTDIR/bin/wagon  -track_start 1 -vertex_output mean -desc festival/clunits/mcep.desc -data &#39;festival/feats/i_2.feats&#39; -test &#39;festival/feats/i_2.feats&#39; -balance 0 -track &#39;festival/disttabs/i_2.mcep&#39; -stop 50 Dataset of 16347 vectors of 62 parameters from: festival/feats/i_2.feats<br>
</div></div><br>
<br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>SIOD ERROR: not a number : -nan<br>
closing a file left open: festival/trees/msu_ru_nsh_mcep.rawparams</div></div><br>
<br>
У вас тут ещё и nan затесался. Это значит что файлы коэффициентов были неправильно рассчитаны. Либо отметки периодов (pitchmarks) съехали, либо были в записях промежутки абсолютной тишины. Надо проверить значения коэффициентов во всех mcep файлах.]]></description>
        <author>nsh</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2842968</guid>
        <pubDate>Wed, 02 Mar 2011 07:18:13 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2842968</link>
        <description><![CDATA[zamir: Не помогло  :&#39;( <br>
Увеличивал значение по умолчанию в 2 и в 5 раз<br>
Таже самая ошибка в том же самом месте <br>
<br>
<span class="tag-color tag-color-named" data-value="gray" style="color: gray"><span class='tag-size' data-value='7' style='font-size:7pt;'>Добавлено <time class="tag-mergetime" datetime="2011-03-02T07:40:38+00:00">02.03.11, 07:40</time></span></span><br>
может это сообщение возникает из-за того что в вашем файле msu_ru_nsh_phrasing.scm<br>
указано (set_backtrace t)<br>
? <br>
<br>
<span class="tag-color tag-color-named" data-value="gray" style="color: gray"><span class='tag-size' data-value='7' style='font-size:7pt;'>Добавлено <time class="tag-mergetime" datetime="2011-03-02T07:43:54+00:00">02.03.11, 07:43</time></span></span><br>
если не считать это ошибкой то вроеде всё собрается<br>
но синтерзатор не работ<br>
на вывод ошибок выводится:<br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>Attempt to access frame 159 of 0 frame track<br>
Attempt to access frame 123 of 0 frame track<br>
Attempt to access frame 123 of 0 frame track<br>
Attempt to access frame 123 of 0 frame track<br>
Attempt to access frame 181 of 0 frame track<br>
Attempt to access frame 181 of 0 frame track<br>
Attempt to access frame 181 of 0 frame track<br>
Attempt to access frame 0 of 0 frame track<br>
Attempt to access frame 0 of 0 frame track<br>
Attempt to access frame 0 of 0 frame track<br>
Attempt to access frame 0 of 0 frame track<br>
Attempt to access frame 0 of 0 frame track</div></div><br>
<br>
на стандартный вывод:<br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>ClusterGen: can&#39;t find cluster tree for pau_3<br>
ClusterGen: can&#39;t find cluster tree for pau_3<br>
ClusterGen: can&#39;t find cluster tree for pau_3<br>
ClusterGen: can&#39;t find cluster tree for pau_3<br>
ClusterGen: can&#39;t find cluster tree for pau_3<br>
ClusterGen: can&#39;t find cluster tree for pau_3<br>
ClusterGen: can&#39;t find cluster tree for pau_3<br>
ClusterGen: can&#39;t find cluster tree for pau_3<br>
ClusterGen: can&#39;t find cluster tree for pau_3<br>
ClusterGen: can&#39;t find cluster tree for pau_3<br>
ClusterGen: can&#39;t find cluster tree for d_1<br>
ClusterGen: can&#39;t find cluster tree for d_1<br>
ClusterGen: can&#39;t find cluster tree for d_1<br>
ClusterGen: can&#39;t find cluster tree for d_1</div></div>]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2842844</guid>
        <pubDate>Tue, 01 Mar 2011 21:16:28 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2842844</link>
        <description><![CDATA[zamir: Спасибо.<br>
На сколько я понял<br>
<br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>if [ &#036;1 = &quot;cluster&quot; ]                                                                                                                                                                               <br>
then                                                                                                                                                                                                <br>
   &#036;ESTDIR/../festival/bin/festival --heap 10000000  -b &#036;CLUSTERGENDIR/clustergen_build.scm festvox/build_clunits.scm festvox/&#036;{FV_VOICENAME}_cg.scm &#39;(build_clustergen &quot;&#39;&#036;PROMPTFILE&#39;&quot;)&#39;           <br>
   exit 0                                                                                                                                                                                           <br>
fi        </div></div>                      <br>
<br>
меняю на<br>
<br>
<div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>if [ &#036;1 = &quot;cluster&quot; ]                                                                                                                                                                               <br>
then                                                                                                                                                                                                <br>
   &#036;ESTDIR/../festival/bin/festival --heap 20000000  -b &#036;CLUSTERGENDIR/clustergen_build.scm festvox/build_clunits.scm festvox/&#036;{FV_VOICENAME}_cg.scm &#39;(build_clustergen &quot;&#39;&#036;PROMPTFILE&#39;&quot;)&#39;           <br>
   exit 0                                                                                                                                                                                           <br>
fi  </div></div><br>
<br>
сейчас попробую]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2842838</guid>
        <pubDate>Tue, 01 Mar 2011 21:11:25 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2842838</link>
        <description><![CDATA[nsh: Сталкивался, почему не сталкивался. Ещё памяти надо добавить в стек (--heap)]]></description>
        <author>nsh</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2842836</guid>
        <pubDate>Tue, 01 Mar 2011 21:06:18 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2842836</link>
        <description><![CDATA[zamir: всё равно не собирается на том же этапе  :( <br>
ошибки касающиеся состояний исчезли но вылезает BACKTRACE<br>
не сталкивались с таким?<br>
<br>
<div class='tag-code'><span class='pre_code'></span><div class='code  code_collapsed ' title='Подсветка синтаксиса доступна зарегистрированным участникам Форума.' style=''><div><div><ol type="1"><div class="code_line">$ESTDIR/bin/wagon &nbsp;-track_start 1 -vertex_output mean -desc festival/clunits/mcep.desc -data &#39;festival/feats/i_2.feats&#39; -test &#39;festival/feats/i_2.feats&#39; -balance 0 -track &#39;festival/disttabs/i_2.mcep&#39; -stop 50 Dataset of 16347 vectors of 62 parameters from: festival/feats/i_2.feats</div><div class="code_line">Dataset of 16347 vectors of 62 parameters from: festival/feats/i_2.feats</div><div class="code_line">RMSE 0.5147 Correlation is 0.9432 Mean (abs) Error 0.1377 (0.4959)</div><div class="code_line">Dataset of 25266 vectors of 62 parameters from: festival/feats/i_3.feats</div><div class="code_line">Dataset of 25266 vectors of 62 parameters from: festival/feats/i_3.feats</div><div class="code_line">RMSE 0.5442 Correlation is 0.8805 Mean (abs) Error 0.1442 (0.5248)</div><div class="code_line">Dataset of 30432 vectors of 62 parameters from: festival/feats/pau_1.feats</div><div class="code_line">Dataset of 30432 vectors of 62 parameters from: festival/feats/pau_1.feats</div><div class="code_line">RMSE 0.0875 Correlation is 0.9035 Mean (abs) Error 0.0638 (0.0599)</div><div class="code_line">Dataset of 8292 vectors of 62 parameters from: festival/feats/pau_2.feats</div><div class="code_line">Dataset of 8292 vectors of 62 parameters from: festival/feats/pau_2.feats</div><div class="code_line">RMSE 0.1207 Correlation is 0.9661 Mean (abs) Error 0.0769 (0.0930)</div><div class="code_line">Dataset of 17248 vectors of 62 parameters from: festival/feats/pau_3.feats</div><div class="code_line">Dataset of 17248 vectors of 62 parameters from: festival/feats/pau_3.feats</div><div class="code_line">RMSE 0.2080 Correlation is 0.8451 Mean (abs) Error 0.0862 (0.1893)</div><div class="code_line">SIOD ERROR: not a number : -nan</div><div class="code_line">closing a file left open: festival/trees/msu_ru_nsh_mcep.rawparams</div><div class="code_line">closing a file left open: festival/trees/msu_ru_nsh_mcep.tree</div><div class="code_line">-output &#39;festival/trees/i_2_mcep.tree&#39; </div><div class="code_line">Clustergen mcep tree build on: i_3</div><div class="code_line">$ESTDIR/bin/wagon &nbsp;-track_start 1 -vertex_output mean -desc festival/clunits/mcep.desc -data &#39;festival/feats/i_3.feats&#39; -test &#39;festival/feats/i_3.feats&#39; -balance 0 -track &#39;festival/disttabs/i_3.mcep&#39; -stop 50 -output &#39;festival/trees/i_3_mcep.tree&#39; </div><div class="code_line">Clustergen mcep tree build on: pau_1</div><div class="code_line">$ESTDIR/bin/wagon &nbsp;-track_start 1 -vertex_output mean -desc festival/clunits/mcep.desc -data &#39;festival/feats/pau_1.feats&#39; -test &#39;festival/feats/pau_1.feats&#39; -balance 0 -track &#39;festival/disttabs/pau_1.mcep&#39; -stop 50 -output &#39;festival/trees/pau_1_mcep.tree&#39; </div><div class="code_line">Clustergen mcep tree build on: pau_2</div><div class="code_line">$ESTDIR/bin/wagon &nbsp;-track_start 1 -vertex_output mean -desc festival/clunits/mcep.desc -data &#39;festival/feats/pau_2.feats&#39; -test &#39;festival/feats/pau_2.feats&#39; -balance 0 -track &#39;festival/disttabs/pau_2.mcep&#39; -stop 50 -output &#39;festival/trees/pau_2_mcep.tree&#39; </div><div class="code_line">Clustergen mcep tree build on: pau_3</div><div class="code_line">$ESTDIR/bin/wagon &nbsp;-track_start 1 -vertex_output mean -desc festival/clunits/mcep.desc -data &#39;festival/feats/pau_3.feats&#39; -test &#39;festival/feats/pau_3.feats&#39; -balance 0 -track &#39;festival/disttabs/pau_3.mcep&#39; -stop 50 -output &#39;festival/trees/pau_3_mcep.tree&#39; </div><div class="code_line">BACKTRACE:</div><div class="code_line">&nbsp;&nbsp; 0: (f (car l2))</div><div class="code_line">&nbsp;&nbsp; 1: (cons (f (car l2)) r)</div><div class="code_line">&nbsp;&nbsp; 2: (set! r (cons (f (car l2)) r))</div><div class="code_line">&nbsp;&nbsp; 3: (while l2 (set! r (cons (f (car l2)) r)) (set! l2 (cdr l2)))</div><div class="code_line">&nbsp;&nbsp; 4: (mapcar</div><div class="code_line">&nbsp;&nbsp; &nbsp;(lambda</div><div class="code_line">&nbsp;&nbsp; &nbsp; (x)</div><div class="code_line">&nbsp;&nbsp; &nbsp; (...))</div><div class="code_line">&nbsp;&nbsp; &nbsp;(caar tree))</div><div class="code_line">&nbsp;&nbsp; 5: (clustergen::dump_tree_vectors (car (cdr (cdr tree))) rawtrackfd)</div><div class="code_line">&nbsp;&nbsp; 6: (clustergen::dump_tree_vectors (car (cdr tree)) rawtrackfd)</div><div class="code_line">&nbsp;&nbsp; 7: (clustergen::dump_tree_vectors (car (cdr tree)) rawtrackfd)</div><div class="code_line">&nbsp;&nbsp; 8: (clustergen::dump_tree_vectors (car (cdr (cdr tree))) rawtrackfd)</div><div class="code_line">&nbsp;&nbsp; 9: (clustergen::dump_tree_vectors (car (cdr (cdr tree))) rawtrackfd)</div><div class="code_line">&nbsp;&nbsp;10: (clustergen::dump_tree_vectors (car (cdr (cdr tree))) rawtrackfd)</div><div class="code_line">&nbsp;&nbsp;11: (clustergen::dump_tree_vectors (car (cdr tree)) rawtrackfd)</div><div class="code_line">&nbsp;&nbsp;12: (clustergen::dump_tree_vectors (car (cdr tree)) rawtrackfd)</div><div class="code_line">&nbsp;&nbsp;13: (clustergen::dump_tree_vectors (car (cdr (cdr tree))) rawtrackfd)</div><div class="code_line">&nbsp;&nbsp;14: (clustergen::dump_tree_vectors tree rawtrackfd)</div><div class="code_line">&nbsp;&nbsp;15: (set! tree (clustergen::dump_tree_vectors tree rawtrackfd))</div><div class="code_line">&nbsp;&nbsp;16: (f (car l2))</div><div class="code_line">&nbsp;&nbsp;17: (cons (f (car l2)) r)</div><div class="code_line">&nbsp;&nbsp;18: (set! r (cons (f (car l2)) r))</div><div class="code_line">&nbsp;&nbsp;19: (while l2 (set! r (cons (f (car l2)) r)) (set! l2 (cdr l2)))</div><div class="code_line">&nbsp;&nbsp;20: (mapcar</div><div class="code_line">&nbsp;&nbsp; &nbsp;(lambda</div><div class="code_line">&nbsp;&nbsp; &nbsp; (unit)</div><div class="code_line">&nbsp;&nbsp; &nbsp; (...)</div><div class="code_line">&nbsp;&nbsp; &nbsp; ...)</div><div class="code_line">&nbsp;&nbsp; &nbsp;unittypes)</div><div class="code_line">&nbsp;&nbsp;21: (if</div><div class="code_line">&nbsp;&nbsp; &nbsp;cg:multimodel</div><div class="code_line">&nbsp;&nbsp; &nbsp;(begin</div><div class="code_line">&nbsp;&nbsp; &nbsp; (format t &quot;Building multimodels: static </div><div class="code_line">&quot;)</div><div class="code_line">&nbsp;&nbsp; &nbsp; (set! cg::cluster_feats &quot;-track_feats 1-25&quot;)</div><div class="code_line">&nbsp;&nbsp; &nbsp; ...)</div><div class="code_line">&nbsp;&nbsp; &nbsp;...)</div><div class="code_line">&nbsp;&nbsp;22: (build_clustergen &quot;etc/txt.done.data&quot;)</div></ol></div></div></div></div>]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2842049</guid>
        <pubDate>Tue, 01 Mar 2011 09:40:04 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2842049</link>
        <description><![CDATA[nsh: <div class='tag-quote'><span class='tag-quote-prefix'>Цитата</span> <div class='quote '>эта классификация так же как и в sphinx влияет только на качество разметки ehmm ?<br>
</div></div><br>
<br>
Классы используются для выбора сегментов для синтеза и влияют на его качество.]]></description>
        <author>nsh</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2842044</guid>
        <pubDate>Tue, 01 Mar 2011 09:34:07 +0000</pubDate>
        <title>Новая база для синтеза речи</title>
        <link>https://forum.sources.ru/index.php?showtopic=204030&amp;view=findpost&amp;p=2842044</link>
        <description><![CDATA[zamir: во, теперь понятно  :) <br>пока я разбирался переделал градацию подъёма и положение языка с 5ти значной шкалы на 3х значную<br>пока собирается вроде<br>эта классификация так же как и в sphinx влияет только на качество разметки ehmm ?]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      </channel>
      </rss>
	