Наши проекты:
Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту |
||
ПРАВИЛА | FAQ | Помощь | Поиск | Участники | Календарь | Избранное | RSS |
[35.173.48.18] |
|
Страницы: (19) 1 2 [3] 4 5 ... 18 19 все ( Перейти к последнему сообщению ) |
Сообщ.
#31
,
|
|
|
Ну, вобщем, да. Тренируются модели и они выдают первоначальную разметку. Не всегда оптимальную, конечно.
|
Сообщ.
#32
,
|
|
|
Доброго времени суток!
на сайте http://download.berlios.de/festlang/ есть примеры синтеза, самый качественный - russian_cl_urp.wav - кластерный синтез с помощью базы urp. однако нигде не нашел, чтоб попробовать, не подскажете, где? скачал msu_ru_nsh_clunits-0.4.tar.gz, но это совсем не то... заранее спасибо! |
Сообщ.
#33
,
|
|
|
В смысле, это оно и есть.
Добавлено Неужели по голосу не слышно |
Сообщ.
#34
,
|
|
|
поковырялся, разобрался что не так сделал...
неплохо, хотя до совершенства, конечно, далеко, часто делает ошибки в словах, причем в сложных. например такое предложение произносит с трудом: К концу октября стада усатых китов и кашалотов начинали миграцию в экваториальную зону. Их принимали малайские и индонезийские базы, а работники Океанской охраны Курильско-Камчатско-Алеутского пояса уходили в отпуск, или занимались любительским патрулированием, или помогали океанологическим и океанографическим экспедициям. как будто из слов буквы повыкидывал и пытается сказать... что интересно, ошибки делает там, где, например неопытный читатель будет делать. может будет эффективней создать БД на несколько десятков тысяч слов (например со словаря взять) с ударениями и транскрипцией и использовать его? иногда не произносятся отдельно стоящие буквы. слово "черная" надо задавать как "чорная", иначе неправильно произносить будет... в общем еще дорабатывать нада... чем могу помочь? и как обстоят дела в распознавании? можно ли научить распознавать Сфинкс три тысячи русских слов? |
Сообщ.
#35
,
|
|
|
Цитата иногда не произносятся отдельно стоящие буквы Это проблемы с разметкой, смотрите выше. Цитата слово "черная" надо задавать как "чорная", иначе неправильно произносить будет... Модуль расстановки ё отсутствует пока. Цитата может будет эффективней создать БД на несколько десятков тысяч слов (например со словаря взять) с ударениями и транскрипцией и использовать его? Вобщем-то так и сделано, сейчас используется словарь на 180000 слов. Но как бы в русском языке их немного больше . Надо в целом прикрутить систему русской морфологии с http://aot.ru Цитата чем могу помочь? Ну вроде вы и сами наметили круг задач. Хотя мне сейчас коррекция разметки актуальнее. Надо попробовать натренировать модель с HTK с начальной ручной разметкой. Может быть лучше будет гораздо. Сейчас почему-то гласные слишком короткие, а согласные слишком длинные. Цитата и как обстоят дела в распознавании? можно ли научить распознавать Сфинкс три тысячи русских слов? Можно, почему нельзя. Смотрите тему База данных для распознавания, скачивайте модель с http://voxforge.org, присылайте записи голоса для базы. |
Сообщ.
#36
,
|
|
|
С английским норм работает, а вот с русским такая проблема:
festival> (tts_file "1.txt" nil) LTS_Ruleset russian_downcase: no rule matches: LTS_Ruleset: # � *here* � � p r i v e t # closing a file left open: 1.txt Текстовый фаил в формате UTF-8. Не подскажете в чем может быть проблема ? Вот сам фаил 1.txt: privet привет |
Сообщ.
#37
,
|
|
|
Точку перед privet уберите. Это что, UTF BOF? Его не нужно.
|
Сообщ.
#38
,
|
|
|
Никакой точки там нет. Текст в UTF-8. Может я что то недоустановил ?
|
Сообщ.
#39
,
|
|
|
В UTF-8 текстах иногда встречается заголовок, называющийся BOF (Beginning of the file, код 0xFF 0xBF по-моему), некоторые редакторы делают его, а некоторые позволяют его удалять. Удалите этот заголовок, пожалуйста.
Добавлено На худой конец попробуйте распаковать файло отсюда: http://nshmyrev.narod.ru/temp/test.zip |
Сообщ.
#40
,
|
|
|
Правильнее будет указать festival'ю, что этот заголовок можно не учитывать.
|
Сообщ.
#41
,
|
|
|
Все спасибо =) Разобрался.
|
Сообщ.
#42
,
|
|
|
Цитата nsh @ Выложил новую базу для синтеза речи. Два часа сбалансированного текста, записанного в студии диктором радио. База размечена автоматически и созданы голоса для Festival, вот образец синтеза: http://nshmyrev.narod.ru/temp/example.wav Скачать всё можно как обычно: http://download.berlios.de/festlang/msu_ru_nsh_clunits-0.4.tar.gz (200 Mb) Пока ещё в базе не до конца проверены ударения и наличие ё, немного неправильно расставлены паузы. Помогайте исправить. А кто делал эту базу? И с помощью чего она автоматически размечалась? |
Сообщ.
#43
,
|
|
|
Поясните, пожалуйста, где этот файл находится? |
Сообщ.
#44
,
|
|
|
в архиве с голосом
|
Сообщ.
#45
,
|
|
|
Цитата nsh @ Выложил новую базу для синтеза речи. Два часа сбалансированного текста, записанного в студии диктором радио. База размечена автоматически и созданы голоса для Festival, вот образец синтеза: http://nshmyrev.narod.ru/temp/example.wav Скачать всё можно как обычно: http://download.berlios.de/festlang/msu_ru_nsh_clunits-0.4.tar.gz (200 Mb) Пока ещё в базе не до конца проверены ударения и наличие ё, немного неправильно расставлены паузы. Помогайте исправить. Скажите, пожалуйста, а имеется ли список всех предложений, которые читает диктор? Или хотя бы части. Если есть, будьте добры, выложить. |