На главную Наши проекты:
Журнал   ·   Discuz!ML   ·   Wiki   ·   DRKB   ·   Помощь проекту
ПРАВИЛА FAQ Помощь Участники Календарь Избранное RSS
msm.ru
Модераторы: RaD, nsh
  
> Отличить язык речи от другого (два языка)
    Доброго времени суток. Реально ли без словарей разработать алгоритм по определению принадлежности к одному или второму языку. Иными словами на входе имеем WAV, на выходе вероятность наличия первого или второго языка (их два).
      Реально, почему нет. Есть много алгоритмов, наиболее точный и популярный сейчас - и-вектора. Если речи больше 30 секунд и мало музыки/шума, то работает хорошо. Если речи 3 секунды, то сложнее.

      http://people.csail.mit.edu/sshum/talks/iv...h_27Aug2011.pdf

      Нужно набрать данные обоих языков по 10 часов примерно, и натренировать i-vector extractor. Скрипты для тренировки тут есть:

      https://github.com/kaldi-asr/kaldi/tree/master/egs/lre07/v2

      Тут тоже есть реализация:

      https://pypi.python.org/pypi/SIDEKIT
        Спасибо брат. Буду пробовать.
        0 пользователей читают эту тему (0 гостей и 0 скрытых пользователей)
        0 пользователей:


        Рейтинг@Mail.ru
        [ Script execution time: 0,0579 ]   [ 16 queries used ]   [ Generated: 18.04.24, 12:58 GMT ]