![>](style_images/1/nav_m.gif)
![]() |
Наши проекты:
Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту |
|
ПРАВИЛА | FAQ | Помощь | Поиск | Участники | Календарь | Избранное | RSS |
[3.147.46.96] |
![]() |
|
Страницы: (4) 1 [2] 3 4 все ( Перейти к последнему сообщению ) |
Сообщ.
#16
,
|
|
|
Трансформ Фурье хорошо подходит.
Например его можно использывать для распознавания принадлежности подчерка то или иному человеку, для распознавания художников, и т.п вполне возможно он и тут подойдет, но перед этим надо как то разделить слова на буквы |
Сообщ.
#17
,
|
|
|
Цитата esperanto, 3.09.04, 10:11 Трансформ Фурье хорошо подходит. Например его можно использывать для распознавания принадлежности подчерка то или иному человеку, для распознавания художников, и т.п вполне возможно он и тут подойдет, но перед этим надо как то разделить слова на буквы Не думаю, что это хороший подход, таким способом можно определять стили почерка, классы, но распознавать рукописный текст с приемлемым качесвтом - нет. Главная трудность - специфические искажения, которые возникают при рукописном письме, о чем я писал выше (самопересечение линий, букв, и т.д.). Вот поэтому напрямую этот способ использовать нельзя. Другое дело, когда мы знаем траекторий написния слова, вот тогда к этой траектории можно применить он-лайн методы, в частности сравнение траекторий с использованием FFT. Но выделение траекторий очень сложная задача, для которой до сих пор нет хорошего решения, но это ИМХО самый верный и качественный путь. Один из методов сравнения траекторий здесь |
Сообщ.
#18
,
|
|
|
![]() каковы доминирующие частоты искажений, каков спекрт. может быть обнаружить в спектральной плоскости искажения будет проще, а следовательно можно будет уменьшить их влияние. имхо надо проверять практикой. |
Сообщ.
#19
,
|
|
|
Характер искажений другой - это отклонения в траетории в процессе написания, из-за чего и возникают самопересечения линий и букв, на растровой матрице этого не исправишь, только на траектории, поэтому сначала нужно выделить траекторию, а потом уже можно фильтровать частотные составаляющие
|
Сообщ.
#20
,
|
|
|
esperanto ,
1. Не даром почти во всех языках слова разделяются пробелами. Рукописный текст проще разбивать по словам. 2. Думаю, что распознавалка, встроенная в человека не мелочится на буквы... Точнее, со временем, обучившись, перестаёт мелочится, распознавая буквы. Думаю, что многие замечали это при чтении. Таким образом, самый подходящий способ для рукописной распознавалки - итеративное распознавание слов целиком. Например, слово "Интеллектуальный" имеет массу вариаций, связанных с падежами, родами и т.п.. Надеюсь, что Фурье преобразование сможет подвести нас к подмножеству слов с этим корнем. А дальше - дело техники. Естественно, что такой подход потребует коллосальной базы знаний... а, может быть, можно создать алгоритм, что-то вроде кэш-функций для слов с одинаковым корнем, который позволит связать импульсы Фурье с определёнными вариациями слова... ![]() Мдя... Сюдабы примеры кода уже существующих реализаций! Да мы! Да я! Я бы тут... Ух! ![]() |
Сообщ.
#21
,
|
|
|
2. Думаю, что распознавалка, встроенная в человека не мелочится на буквы... Точнее, со временем, обучившись, перестаёт мелочится, распознавая буквы. Думаю, что многие замечали это при чтении.
Скорей всего это неверно. Просто пока идет процесс накопления знаний - образ не хранится в той доли мозга которая отвечает за шаблоны соответствия зрительных образов(скорей всего хранится и накапливается, но матрица помечена как "не рабочая пока"). Когда же они туда попадают, человеку не требуется привлекать процессы, связанные с сознанием, для понимания буквы - таким образом, задумываться над буквой человеку не требуется. Первый факт так же скорей всего не дает пользы(неверен вывод по поводу пробелов). Преобразование фурье в данной ситуации может как помочь так и навредить - дело почерка. Современные системы распознавания основаны как я знаю - на базе нейронных сетей. Когда то пробовались системы фильтрующии для начала буквы по количеству самопересечений. Вобщем сложно все это ... кол-во книг посвященных этой теме этот факт подтверждает (может стоит их почитать раз тема интересует). |
Сообщ.
#22
,
|
|
|
Вопрос
Добавлено в : <...Преобразование фурье в данной ситуации может как помочь так и навредить - дело почерка...> А можно поинтересоваться, к чему по вашему мнению нужно применять преобразование Фурье - к растровой матрице, к скелету, к траектории? И в каких случаях это может навредить? Добавлено в : <...2. Думаю, что распознавалка, встроенная в человека не мелочится на буквы... Точнее, со временем, обучившись, перестаёт мелочится, распознавая буквы. Думаю, что многие замечали это при чтении....> Не совсем. Человек со временем перестает распознавать окончания, он просто восстанавливает их по контексту. В доказательство этому можно привести факт, что прибыстром чтении человек не обращает внимение на некоторую несогласованность окончаний, и даже на перестановки букв в словах, из-за чего иногода нчеловек неправильно рапсознает слово, принимая его за слово, в котором набор букв сходен. Особенно это заметно при быстром чтении |
Сообщ.
#23
,
|
|
|
Цитата Y-Vladimir, 6.09.04, 14:47 из-за чего иногода нчеловек неправильно рапсознает слово, принимая его за слово, в котором набор букв сходен Вот именно - мне кажется, что здесь применим один из способов контекстного моделирования марковского источника при сжатии - PPM ( Prediction by Partial Match - предсказание по частичному совпадению ) - здесь можно будет решить проблему с сокращениями ( кстати о ней никто не вспомнил ) и орфографическими ошибками. Но это уже на том этапе, когда реализовано разделение слов на буквы. А как сделать последнее - не представляю. Только представил себе все возможные помехи и искаженя - аш голова закружилась.. Воистину - без артифисиал интелидженса не обойтись. |
Сообщ.
#24
,
|
|
|
С сокращениями лекго справиться, поместив их в словарь, а с орфографическими ошибками - сделав нечеткий поиск по словарю. Так что это не проблема в практической реализации. Разделение слов на буквы мы тоже сделали, но этот алгоритм работает в тесном взаимодействии со всеми остальными (поиск по словарю, выделение траектории, сравнение траекторий), другого и не ожидалось, т.к. разделить слово на буквы не пользуясь больше инчем однозначно невозможно. Сейчас реализуем корректное выделение траетории, что очень не просто. Со сравнением траекторий вопрос тоже решен - найден неплохой алгоритм, мало зависящий от помех и неточностей написания.
Пок мы ограничились предположением, что рукописное слово написано средним почерком и неразрывно (т.е. слитно). Случаи плохого почерка пока не рассматриваем. |
Сообщ.
#25
,
|
|
|
Цитата Y-Vladimir, 6.09.04, 15:29 С сокращениями лекго справиться, поместив их в словарь Все не предусмотришь. Например слово количество моджет быть обозначено количество кол-во к-во кол. колич. итд... И еще учитывай, что вместо тире и точки могут исп. др. знаки, или не быть вообще: колво кол/во кол кво итд... вобщем у каждого человека может быть собственный стиль сокращений. Сиситема, наделенная интелектом без проблем распознает это слово, а вот словарь... |
Сообщ.
#26
,
|
|
|
Цитата А можно поинтересоваться, к чему по вашему мнению нужно применять преобразование Фурье - к растровой матрице, к скелету, к траектории? И в каких случаях это может навредить? Я вроде сообшал что этого делать не стоит. Навредить скорей всего не может, так же как и помочь. Но если встает вопрос какой должен быть ввод в систему распознавания, то думаю, что мозги получают растр, а вот далее??? переводят его в векторную форму и потом последовательно применяют шаблоны, а впрочем может работают со скелетом, а может и с растром (думаю, что скорей всего в векторную форму, потом в растр, а потом работают с полученым растром). Тут дело в другом - факт(по крайней мере меня когда то так учили) что мозги работают по принципу сравнивания всего с шаблонами. Распознавания слова из букв не читая слова целиком - из той же оперы. Грустно в этом факте по крайней мере одно, если мозги могут натравить кучу шаблонов на полученый образ одновременно, то комп, увы, может проделать это только последовательно . Отсюда вывод : надо или идти другим путем, или пытаться оптимизировать данный алгоритм. |
Сообщ.
#27
,
|
|
|
Цитата Gunnar, 6.09.04, 15:35 Все не предусмотришь. Например слово количество моджет быть обозначено количество кол-во к-во кол. колич. итд... А всего и не надо, это в принципе проблема чито техническая, вообщем мелочи это, главное это алгоритм распознавания |
Сообщ.
#28
,
|
|
|
Имхо, нереально. У каждого человека свой подчерк
|
Сообщ.
#29
,
|
|
|
Вот, вы тут пишите невозможно, невозможно, а каждый день PocketPC текст от руки пишу слитно, не стараясь выводить буквы, а как обычно, и он меня прекрасно понимает (использую Transcriber оно MS'вское кажеться).
|
Сообщ.
#30
,
|
|
|
Возможно, но сложно. На столько сложно, что в наших форумовских условиях - невозможно!
![]() |