
![]() |
Наши проекты:
Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту |
|
ПРАВИЛА | FAQ | Помощь | Поиск | Участники | Календарь | Избранное | RSS |
[18.188.124.221] |
![]() |
|
Страницы: (7) « Первая ... 5 6 [7] все ( Перейти к последнему сообщению ) |
Сообщ.
#91
,
|
|
|
zamir
Ага, спасибо. Понял. |
Сообщ.
#92
,
|
|
|
А я мучаю метод Roman55555.Многие слова распознаёт на ура!
Но становится вопрос о транскрипции в его архиве есть "перевод" русских букв на англйские фонемы. Вопрос.Что значат вот эти символы?В xml не знаю в каком порядке должны идти... ![]() ![]() - syllable boundary (hyphen) 1 ! Sentence terminator (exclamation mark) 2 & word boundary 3 , Sentence terminator (comma) 4 . Sentence terminator (period) 5 ? Sentence terminator (question mark) 6 _ Silence (underscore) 7 1 Primary stress 8 2 Secondary stress 9 |
Сообщ.
#93
,
|
|
|
_ вроде как тишина написано
1 первичное ударение 2 вторичное ударение & гранца слова остальное вроде как знаки припенания |
Сообщ.
#94
,
|
|
|
Спасибо,в принципе как и предпологал.
Но как это правильно использовать в правилах grammar в xml? И зачем знаки припенания,если в правилах настраивается только для одного слова?Или они уже для движка TTS? |
Сообщ.
#95
,
|
|
|
Не знаю
![]() Я использую sphinx. Вместо XML языковую модель в sphinx указывается в JSGF (по идеи смысловая нагрузка таже самая) вот пример моего файла Цитата #JSGF V1.0; grammar camera; public <camera> = ( <doo1> | <doo2> | <do3> ); <doo1> = <do1> ( <cam1> <prenum> <num1> | <num2> <cam1> ); <doo2> = <do2> ( <cam2> <prenum> <num1> | <num3> <cam2> | <allcam> ); <do1> = ( включить | подключить | выключить | отключить | опросить ); <do2> = ( опросить | опросить состояние | состояние | статус | описание ); <do3> = ( пока | пока пока | досвидание | положить трубку ); <cam1> = ( камеру | видео-камеру ); <cam2> = ( камеры | видео-камеры ); <allcam> = ( всех камер | всех видео-камер | каждой <cam2> ); <prenum> = [ номер ]; <num1> = ( один | два | три | четыре | пять | шесть | семь | восемь | девять ); <num2> = ( первую | вторую | третью | четвёртую | пятую | шестую | седьмую | восьмую | девятую ); <num3> = ( первой | второй | третьей | четвёртой | пятой | шестой | седьмой | восьмой | девятой ); для сравнения JSGF и XML grammar.xml ![]() ![]() <?xml version="1.0"?> <grammar xmlns="http://www.w3.org/2001/06/grammar" xml:lang="en-US" version="1.0" mode="voice" root="digit"> <rule id="digit"> <one-of> <item>one</item> <item>two</item> <item>three</item> </one-of> </rule> </grammar> grammar.jsgf ![]() ![]() #JSGF V1.0; grammar digits; public <numbers> = (one | two | three); |
Сообщ.
#96
,
|
|
|
Ребята, вопрос.
Есть куча надиктованных mp3-файлов и набранные с них тексты. Можно ли их использовать для обучения системы распознаванию? |
Сообщ.
#97
,
|
|
|
да. я так и делаю.
буду рад, если вы поделитесь своими файлами. |
Сообщ.
#98
,
|
|
|
я вам в личку мой имейл бросил, можете ответить?
|
Сообщ.
#99
,
|
|
|
Roman55555 Как работает код на C# c английскими фонемами? Я написал программу по распознаванию русской речи с библиотекой sphinx. Единственная проблема это пополнение базы словаря. Хотелось чтобы можно было делать это автоматом, т.е. имеется слово в единственном или множественном числе, далее создается морфема слова автоматом.
|