На главную
ПРАВИЛА FAQ Помощь Участники Календарь Избранное DigiMania RSS
msm.ru
Модераторы: RaD, nsh
  
> Поиск решения для диктовки текста, Поиск готового решения для диктовки "вольного" текста
    Столкнулся с принципиальной сложностью поиска готового решения (в т.ч. платного) для распознания голоса в текст в режиме приближенном к реальному времени, для цели надиктовывания длинных текстов.
    ПО "готовое к употреблению" на базе Google- Yandex-API, давало неприемлемый результат.
    Spxinx и Julius (с моделью с Voxforge, с моделями собранными на записях собственного голоса) тоже.
    Неприемлемость результатов делилась на две категории: низкое качество распознавания и нехватка словаря/неточность в выборе слова.
    А при частом использовании в тексте технических терминов, жаргонизмов и т.п. вообще просто беда :-( Надиктованный текст местами превращается в полную "муть".
    И если записана хотя бы 1000-2000 слов, то приведение этого текста к изначальному смысловому значению соизмеримо по времени и трудозатратам с его набором "с ноля".
    Пришёл к выводу, что проблему можно обойти, если иметь инструмент, который можно настроить на выдачу слов с "уверенностью" ниже установленного порога в виде слогов/набора фонем/дифонов/трифонов
    или других сырых данных, по которым программа пытается распознать слово.
    Приведу пример:

    Текст: "...Чучундра чумыкнула осоловевшего бегемота, ловко извернувшись, бросилась прочь...".
    Результат: "чучундра чумы канва соловья в сова бегемота ловко из вернувшись бросилась прочь" (Алиса. Только что).
    Правка такого черновика бесперспективна но, вполне подойдёт вариант вида: "чучундра ch-u-m-i-n-u-a a-s-a-ll-ee-v-ch-e-o бегемота..." (либо другие вариант, где "сырые" данные можно будет легко прочесть и преобразовать в слово силами нейросети собственного мозга).

    Вопрос к знатокам - реализуема-ли подобная схема в теории? Знает ли кто-нибудь доступный "простым смертным" инструмент подобного рода? Есть ли здесь специалисты, способные "запилить" подобное на базе общедоступных исходников за скромное вознаграждение?

    Может кто-нибудь сможет помочь хотя бы советом?

    Заранее благодарю всех, кто откликнется.
    1 пользователей читают эту тему (1 гостей и 0 скрытых пользователей)
    0 пользователей:


    Рейтинг@Mail.ru
    [ Script Execution time: 0,0552 ]   [ 14 queries used ]   [ Generated: 20.06.18, 21:06 GMT ]