<?xml version='1.0' encoding="utf-8"?>
      <rss version='2.0'>
      <channel>
      <title>Форум на Исходниках.RU</title>
      <link>https://forum.sources.ru</link>
      <description>Форум на Исходниках.RU</description>
      <generator>Форум на Исходниках.RU</generator>
  	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=411330&amp;view=findpost&amp;p=3828908</guid>
        <pubDate>Tue, 21 Apr 2020 10:22:47 +0000</pubDate>
        <title>Модель для Kaldi</title>
        <link>https://forum.sources.ru/index.php?showtopic=411330&amp;view=findpost&amp;p=3828908</link>
        <description><![CDATA[nsh: Выложил kaldi-ru-0.9<br>
<br>
<a class='tag-url' href='https://alphacephei.com/kaldi/kaldi-ru-0.9.tar.gz' target='_blank'>https://alphacephei.com/kaldi/kaldi-ru-0.9.tar.gz</a>  (2.5Gb)<br>
<br>
Натренировал RNNLM<br>
<br>
<div class='tag-code'><span class='pre_code'></span><div class='code  code_collapsed ' title='Подсветка синтаксиса доступна зарегистрированным участникам Форума.' style=''><div><div><ol type="1"><div class="code_line">## WER estimates</div><div class="code_line">&nbsp;</div><div class="code_line">| Model &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;| &nbsp;v0.6 WER &nbsp;| &nbsp;v0.7 WER &nbsp;| &nbsp;v0.8 WER &nbsp;| &nbsp;v0.9 WER &nbsp;|</div><div class="code_line">|------------------------------------------|------------|------------|------------|------------|</div><div class="code_line">| asr_calls_2_val (snakers4/open_stt) &nbsp; &nbsp; &nbsp;| &nbsp; &nbsp;54.47 &nbsp; | &nbsp; &nbsp;47.05 &nbsp; | &nbsp; 41.81 &nbsp; &nbsp;| &nbsp; &nbsp;40.15 &nbsp; |</div><div class="code_line">| public_youtube700_val (snakers4/open_stt)| &nbsp; &nbsp;37.55 &nbsp; | &nbsp; &nbsp;30.13 &nbsp; | &nbsp; 27.46 &nbsp; &nbsp;| &nbsp; &nbsp;26.20 &nbsp; |</div><div class="code_line">| audiobooks (snakers4/open_stt) &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; | &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;| &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;| &nbsp; 17.13 &nbsp; &nbsp;| &nbsp; &nbsp;16.26 &nbsp; |</div><div class="code_line">| audiobooks (our) &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; | &nbsp; &nbsp;8.86 &nbsp; &nbsp;| &nbsp; &nbsp;6.61 &nbsp; &nbsp;| &nbsp; 6.48 &nbsp; &nbsp; | &nbsp; &nbsp;5.71 &nbsp; &nbsp;|</div></ol></div></div></div></div><script>preloadCodeButtons('1');</script><br>
<br>
docker не обновлял, vosk-server не поддерживает ещё rnnlm. rnnlm-ка плохо для русского пошла - большой словарь слишком и модель тренируется плохо. Embeddingи под 3гб. Интересный у нас язык. Но всё равно рекомендуется, так как результат получается гораздо более читаемый. Падежи лучше согласуются и так далее.<br>
<br>
<span class="tag-color tag-color-named" data-value="gray" style="color: gray"><span class='tag-size' data-value='7' style='font-size:7pt;'>Сообщения были разделены в тему &quot;<a class='tag-url' href='https://forum.sources.ru/index.php?showtopic=419756' target='_blank'>spam</a>&quot;</span></span>]]></description>
        <author>nsh</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=411330&amp;view=findpost&amp;p=3826253</guid>
        <pubDate>Mon, 23 Mar 2020 16:22:10 +0000</pubDate>
        <title>Модель для Kaldi</title>
        <link>https://forum.sources.ru/index.php?showtopic=411330&amp;view=findpost&amp;p=3826253</link>
        <description><![CDATA[nsh: Как-то подзабыл про наш форум. Недавно выложил kaldi-ru-0.7<br>
<br>
<a class='tag-url' href='https://alphacephei.com/kaldi/kaldi-ru-0.7.tar.gz' target='_blank'>https://alphacephei.com/kaldi/kaldi-ru-0.7.tar.gz</a>  (1.9Gb)<br>
<br>
Изменения в новый версии:<br>
<br>
Больше модель, натренирована больше эпох + specaugment (не особо полезен)<br>
Больше языковая модель, натренирована на большом корпусе текстов<br>
<br>
Оценки процента ошибок распознавания:<br>
<br>
Данные с <a class='tag-url' href='https://github.com/snakers4/open_stt' target='_blank'>https://github.com/snakers4/open_stt</a> с исправлениями (в папке openstt-ref)<br>
<br>
<div class='tag-code'><span class='pre_code'></span><div class='code  code_collapsed ' title='Подсветка синтаксиса доступна зарегистрированным участникам Форума.' style=''><div><div><ol type="1"><div class="code_line">| Model &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; | &nbsp;v0.6 WER &nbsp;| &nbsp;v0.7 WER &nbsp;|</div><div class="code_line">|-----------------------|------------|------------|</div><div class="code_line">| asr_calls_2_val &nbsp; &nbsp; &nbsp; | &nbsp; &nbsp;54.47 &nbsp; | &nbsp; &nbsp;47.05 &nbsp; |</div><div class="code_line">| public_youtube700_val | &nbsp; &nbsp;37.55 &nbsp; | &nbsp; &nbsp;30.13 &nbsp; |</div><div class="code_line">| audiobooks(our) &nbsp; &nbsp; &nbsp; | &nbsp; &nbsp;8.86 &nbsp; &nbsp;| &nbsp; &nbsp;6.61 &nbsp; &nbsp;|</div></ol></div></div></div></div><br>
<br>
Попробовать через <a class='tag-url' href='http://github.com/alphacep/vosk-api' target='_blank'>vosk-api</a> или докер:<br>
<br>
<div class='tag-code'><span class='pre_code'></span><div class='code  code_collapsed ' title='Подсветка синтаксиса доступна зарегистрированным участникам Форума.' style=''><div><div><ol type="1"><div class="code_line">docker run -p 2700:2700 alphacep/kaldi-ru</div></ol></div></div></div></div>]]></description>
        <author>nsh</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=411330&amp;view=findpost&amp;p=3770249</guid>
        <pubDate>Fri, 25 May 2018 12:45:18 +0000</pubDate>
        <title>Модель для Kaldi</title>
        <link>https://forum.sources.ru/index.php?showtopic=411330&amp;view=findpost&amp;p=3770249</link>
        <description><![CDATA[zamir: Привет<br>Я не специалист в этом вопросе.<br>Лучше обращаться ко всем или к Николаю. В этом случае вероятность получения ответа резко возрастает  ;)<br>А вопрос технический или юридический?<br>Если технический, то kaldi написан на C++, поэтому вопрос интеграции - это вопрос умения работать на C++ с использованием сторонынних библиотек.<br>Если вопрос юридический, то предлагаю прочитать лицензию  :)<br>Вроде ответил, но почему-то есть сомнение, что чем-то помог :)]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=411330&amp;view=findpost&amp;p=3770246</guid>
        <pubDate>Fri, 25 May 2018 12:34:32 +0000</pubDate>
        <title>Модель для Kaldi</title>
        <link>https://forum.sources.ru/index.php?showtopic=411330&amp;view=findpost&amp;p=3770246</link>
        <description><![CDATA[Excalib: <strong class='tag-b'>zamir</strong> Привет, слушай, вопрос мб не совсем по теме, но нужна помощь, не мог бы подсказать как можно использовать калди с этой моделью в своем проекте на плюсах или C#]]></description>
        <author>Excalib</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=411330&amp;view=findpost&amp;p=3741188</guid>
        <pubDate>Thu, 21 Sep 2017 15:19:38 +0000</pubDate>
        <title>Модель для Kaldi</title>
        <link>https://forum.sources.ru/index.php?showtopic=411330&amp;view=findpost&amp;p=3741188</link>
        <description><![CDATA[nsh: Там надо OnlineNnet2FeaturePipeline на OnlineNnetFeaturePipeline менять, не очень тривиальная задача.]]></description>
        <author>nsh</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=411330&amp;view=findpost&amp;p=3741076</guid>
        <pubDate>Thu, 21 Sep 2017 08:14:46 +0000</pubDate>
        <title>Модель для Kaldi</title>
        <link>https://forum.sources.ru/index.php?showtopic=411330&amp;view=findpost&amp;p=3741076</link>
        <description><![CDATA[zamir: Николай, спасибо большое&#33;<br>
<br>
Мой маленький тест модель проходит блестяще :)<br>
Модель на rate 8кГц<br>
Кто-нибудь пробовал запустить эту модель совместно вот с эти проектом?<br>
<a class='tag-url' href='https://github.com/andrenatal/asr-server' target='_blank'>https://github.com/andrenatal/asr-server</a><br>
<br>
Проект подразумевает использование моделей 16кГц<br>
Я сделал небольшие правки, но результат орицательный (на выходе пустая строка)<br>
Есть-ли у кого-нибудь желание помочь или разобраться?  :) <br>
<br>
--- asr-server.16kHz/src/OnlineDecoder.cc	2017-09-20 21:11:56.000000000 +0300<br>
+++ asr-server/src/OnlineDecoder.cc	2017-09-21 11:03:34.699170211 +0300<br>
@@ -19,7 +19,7 @@<br>
 namespace apiai {<br>
 <br>
 #define PAD_SIZE 400<br>
-#define AUDIO_DATA_FREQUENCY 16000<br>
+#define AUDIO_DATA_FREQUENCY 8000<br>
 kaldi::BaseFloat padVector[PAD_SIZE];<br>
<br>
<br>
--- asr-server.16kHz/src/RequestRawReader.h	2017-09-20 21:11:56.000000000 +0300<br>
+++ asr-server/src/RequestRawReader.h	2017-09-21 00:56:04.211189212 +0300<br>
@@ -39,7 +39,7 @@<br>
 		current_chunk_ = NULL;<br>
 <br>
 		is_ = is;<br>
-		frequency_ = 16000;<br>
+		frequency_ = 8000;<br>
 		bytes_per_sample_ = 16 / 8;<br>
 		channels_ = 1;<br>
 		channel_index_ = 0;]]></description>
        <author>zamir</author>
        <category>Речевые Технологии</category>
      </item>
	
      <item>
        <guid isPermaLink='true'>https://forum.sources.ru/index.php?showtopic=411330&amp;view=findpost&amp;p=3740935</guid>
        <pubDate>Wed, 20 Sep 2017 11:38:23 +0000</pubDate>
        <title>Модель для Kaldi</title>
        <link>https://forum.sources.ru/index.php?showtopic=411330&amp;view=findpost&amp;p=3740935</link>
        <description><![CDATA[nsh: Недавно выложили русскую модель для распознавания речи с Kaldi (500 Мб)<br>
<br>
<a class='tag-url' href='http://goo.gl/Rg8ynd' target='_blank'>goo.gl/Rg8ynd</a><br>
<br>
Модель довольно точная, натренирована на больших данных.]]></description>
        <author>nsh</author>
        <category>Речевые Технологии</category>
      </item>
	
      </channel>
      </rss>
	