Наши проекты:
Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту |
||
ПРАВИЛА | FAQ | Помощь | Поиск | Участники | Календарь | Избранное | RSS |
[35.171.45.182] |
|
Сообщ.
#1
,
|
|
|
Доброго времени суток. Реально ли без словарей разработать алгоритм по определению принадлежности к одному или второму языку. Иными словами на входе имеем WAV, на выходе вероятность наличия первого или второго языка (их два).
|
Сообщ.
#2
,
|
|
|
Реально, почему нет. Есть много алгоритмов, наиболее точный и популярный сейчас - и-вектора. Если речи больше 30 секунд и мало музыки/шума, то работает хорошо. Если речи 3 секунды, то сложнее.
http://people.csail.mit.edu/sshum/talks/iv...h_27Aug2011.pdf Нужно набрать данные обоих языков по 10 часов примерно, и натренировать i-vector extractor. Скрипты для тренировки тут есть: https://github.com/kaldi-asr/kaldi/tree/master/egs/lre07/v2 Тут тоже есть реализация: https://pypi.python.org/pypi/SIDEKIT |
Сообщ.
#3
,
|
|
|
Спасибо брат. Буду пробовать.
|