Наши проекты:
Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту |
||
ПРАВИЛА | FAQ | Помощь | Поиск | Участники | Календарь | Избранное | RSS |
[18.222.67.251] |
|
Сообщ.
#1
,
|
|
|
Привет!
Интересуюсь темой распознавания речи. Хочу сделать программку для определения диктора, в качестве задачи на летнюю практику. Уже научился вычислять MFCC для записи. Не могу понять несколько вещей: 1) Как мне обработать записи диктора для использования их в качестве образцов речи 2) Как сравнить образцы с записью? Применим ли в этом случае алгоритм DTW? Эффективен ли он? или стоит выбрать другой? |
Сообщ.
#2
,
|
|
|
Цитата eugeny.anik @ Привет! Интересуюсь темой распознавания речи. Хочу сделать программку для определения диктора, в качестве задачи на летнюю практику. Уже научился вычислять MFCC для записи. Не могу понять несколько вещей: 1) Как мне обработать записи диктора для использования их в качестве образцов речи 2) Как сравнить образцы с записью? Применим ли в этом случае алгоритм DTW? Эффективен ли он? или стоит выбрать другой? Цитата Как мне обработать записи диктора для использования их в качестве образцов речи Тишину отрезать, саму речь лучше не трогать Цитата 2) Как сравнить образцы с записью? Применим ли в этом случае алгоритм DTW? Эффективен ли он? или стоит выбрать другой? Можно DTW применять. Сейчас он не особо популярен. Последний писк что-то вроде такого c нейросетями: https://arxiv.org/pdf/1509.08062.pdf |
Сообщ.
#3
,
|
|
|
Цитата nsh @ Тишину отрезать, саму речь лучше не трогать А если у меня несколько образцов голоса? Я же не могу просто взять средние значения коэффициентов, даже если я выберу за основу DTW. Особенно, если в них будут разные фразы (тексто-независимая идентификация). В некоторых статьях находил советы сравнивать со всеми образцами по очереди, но это приведет к замедлению при увеличении количества образцов. Цитата nsh @ Можно DTW применять. Сейчас он не особо популярен. А почему не популярен? Не популярен именно в сфере идентификации? Или в работе с речью в целом? Спасибо! Уже начал читать! |
Сообщ.
#4
,
|
|
|
Цитата eugeny.anik @ В некоторых статьях находил советы сравнивать со всеми образцами по очереди, но это приведет к замедлению при увеличении количества образцов. Cовет правильный, замедление несущественно, так как DTW быстрый алгоритм. Цитата А почему не популярен? Точность маленькая, так как алгоритм не только отслеживает характеристики голоса, но и учитывает манеру произнесения. Если интонацию изменить, совпадения не будет. Более сложные алгоритмы интонацию нормализуют. |
Сообщ.
#5
,
|
|
|
Спасибо, буду погружаться
|