Наши проекты:
Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту |
||
ПРАВИЛА | FAQ | Помощь | Поиск | Участники | Календарь | Избранное | RSS |
[18.223.21.5] |
|
Сообщ.
#1
,
|
|
|
Прочитал я твой ответ по on-fly обработке звука. Но я не сильно вижу разницу между on-fly и on-line.
Дело в том, что у меня программа получает данные блоками по 8КБ. Такие маленькие блоки можно обработать за один проход. В данный момент я работаю над следующим блоком программы: При получении первого блока он ставится в очередь и все. Последующий блок также попадает в очередь и запускается процесс выделения сигнала с речью. Если в первом блоке таковой не обнаружен, то он отбрасывается и ожидается поступления третьего блока. Если коротко, то для обработки требуется как минимум два блока. Если же в первом блоке есть сигнал и он полностью помещается в этом блоке, то блок передается на дальнейшую обработку. Если же сигнал простирается на следующий блок, то процесс прерывается, оба блока объединяются и как единое целое снова передается на выделение сигнала. Вот таким образом я собираюсь выделять речь из звукового потока. Для выделения я использую алгоритм ENDPOINTER, который уже более 20 лет используется на западе. Алгоритм достаточно прост - он принимает во внимание амплитуду сигнала и количество переходов через нулевую линию. |
Сообщ.
#2
,
|
|
|
Процесс пошёл! Очень рад!
Для начала очень неплохо. Хорошо что произошёл переход от этапа сбора к этапу обработки. Самое сложное ещё ожидает. По поводу on-fly. Я полагаю вы сможете увеличить свою обработочную очередь, если возникнет необходимость, 16Кб это пока для начала. Если ресурсов хватает, то единицой добавления может быть и 8Кб. Суть on-fly от этого не меняется. Главное, что ваша программа не пропустит полезного сигнала. По обработке. Ближайшая цель: Если программа сможет хотя бы на первом этапе понимать сказанные вами буквы, это уже будет продукт для применения. И его можно предлагать на рынок. Конкурировать можно уменьшив его размер до минимума. Сами знаете, что некоторые команды состоят из 3-5 букв, которые произнести по отдельности не затруднительно. |