Система распознавания рукописного текста -> Форум на Исходниках.Ру

	Наши проекты: Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту

Здравствуйте, Гость ! [3.147.46.96]

ПРАВИЛА РАЗДЕЛА

Новое голосование

Система распознавания рукописного текста , Реально или нет?

esperanto

Сообщ. #16 , 03.09.04, 07:11

математик

Профиль · PM

Поощрения: 5 Dgm

Рейтинг (т): 50

Трансформ Фурье хорошо подходит.

Например его можно использывать для распознавания принадлежности подчерка то или иному человеку, для распознавания художников, и т.п

вполне возможно он и тут подойдет, но перед этим надо как то разделить слова на буквы

Y-Vladimir

Сообщ. #17 , 03.09.04, 09:40

Newbie

Профиль · PM

Рейтинг (т): 1

Цитата

esperanto, 3.09.04, 10:11
Трансформ Фурье хорошо подходит.

Например его можно использывать для распознавания принадлежности подчерка то или иному человеку, для распознавания художников, и т.п

вполне возможно он и тут подойдет, но перед этим надо как то разделить слова на буквы

Не думаю, что это хороший подход, таким способом можно определять стили почерка, классы, но распознавать рукописный текст с приемлемым качесвтом - нет. Главная трудность - специфические искажения, которые возникают при рукописном письме, о чем я писал выше (самопересечение линий, букв, и т.д.). Вот поэтому напрямую этот способ использовать нельзя. Другое дело, когда мы знаем траекторий написния слова, вот тогда к этой траектории можно применить он-лайн методы, в частности сравнение траекторий с использованием FFT. Но выделение траекторий очень сложная задача, для которой до сих пор нет хорошего решения, но это ИМХО самый верный и качественный путь.

Один из методов сравнения траекторий здесь

Сообщение отредактировано: Y-Vladimir - 03.09.04, 10:24

esperanto

Сообщ. #18 , 03.09.04, 09:52

математик

Профиль · PM

Поощрения: 5 Dgm

Рейтинг (т): 50

да искажения возникают, но отсюда не ясно что метод использывать нельзя.

каковы доминирующие частоты искажений, каков спекрт.

может быть обнаружить в спектральной плоскости искажения будет проще, а следовательно можно будет уменьшить их влияние.

имхо надо проверять практикой.

Y-Vladimir

Сообщ. #19 , 03.09.04, 10:21

Newbie

Профиль · PM

Рейтинг (т): 1

Характер искажений другой - это отклонения в траетории в процессе написания, из-за чего и возникают самопересечения линий и букв, на растровой матрице этого не исправишь, только на траектории, поэтому сначала нужно выделить траекторию, а потом уже можно фильтровать частотные составаляющие

Shaman

Сообщ. #20 , 03.09.04, 20:09

Unregistered

esperanto ,
1. Не даром почти во всех языках слова разделяются пробелами. Рукописный текст проще разбивать по словам.
2. Думаю, что распознавалка, встроенная в человека не мелочится на буквы... Точнее, со временем, обучившись, перестаёт мелочится, распознавая буквы. Думаю, что многие замечали это при чтении.

Таким образом, самый подходящий способ для рукописной распознавалки - итеративное распознавание слов целиком.
Например, слово "Интеллектуальный" имеет массу вариаций, связанных с падежами, родами и т.п.. Надеюсь, что Фурье преобразование сможет подвести нас к подмножеству слов с этим корнем. А дальше - дело техники. Естественно, что такой подход потребует коллосальной базы знаний... а, может быть, можно создать алгоритм, что-то вроде кэш-функций для слов с одинаковым корнем, который позволит связать импульсы Фурье с определёнными вариациями слова... :rolleyes:

Мдя... Сюдабы примеры кода уже существующих реализаций! Да мы! Да я! Я бы тут... Ух! :lol:

Shirenin

Сообщ. #21 , 05.09.04, 23:38

Junior

Профиль · PM

Рейтинг (т): 1

2. Думаю, что распознавалка, встроенная в человека не мелочится на буквы... Точнее, со временем, обучившись, перестаёт мелочится, распознавая буквы. Думаю, что многие замечали это при чтении.

Скорей всего это неверно. Просто пока идет процесс накопления знаний - образ не хранится в той доли мозга которая отвечает за шаблоны соответствия зрительных образов(скорей всего хранится и накапливается, но матрица помечена как "не рабочая пока"). Когда же они туда попадают, человеку не требуется привлекать процессы, связанные с сознанием, для понимания буквы - таким образом, задумываться над буквой человеку не требуется.

Первый факт так же скорей всего не дает пользы(неверен вывод по поводу пробелов).

Преобразование фурье в данной ситуации может как помочь так и навредить - дело почерка. Современные системы распознавания основаны как я знаю - на базе нейронных сетей. Когда то пробовались системы фильтрующии для начала буквы по количеству самопересечений. Вобщем сложно все это ... кол-во книг посвященных этой теме этот факт подтверждает (может стоит их почитать раз тема интересует).

Y-Vladimir

Сообщ. #22 , 06.09.04, 11:47

Newbie

Профиль · PM

Рейтинг (т): 1

Вопрос

Добавлено в 06.09.04, 11:50:
<...Преобразование фурье в данной ситуации может как помочь так и навредить - дело почерка...>
А можно поинтересоваться, к чему по вашему мнению нужно применять преобразование Фурье - к растровой матрице, к скелету, к траектории? И в каких случаях это может навредить?

Добавлено в 06.09.04, 11:54:
<...2. Думаю, что распознавалка, встроенная в человека не мелочится на буквы... Точнее, со временем, обучившись, перестаёт мелочится, распознавая буквы. Думаю, что многие замечали это при чтении....>
Не совсем. Человек со временем перестает распознавать окончания, он просто восстанавливает их по контексту. В доказательство этому можно привести факт, что прибыстром чтении человек не обращает внимение на некоторую несогласованность окончаний, и даже на перестановки букв в словах, из-за чего иногода нчеловек неправильно рапсознает слово, принимая его за слово, в котором набор букв сходен. Особенно это заметно при быстром чтении

Gunnar

Сообщ. #23 , 06.09.04, 12:10

Senior Member

Профиль · PM

Рейтинг (т): 38

Цитата

Y-Vladimir, 6.09.04, 14:47
из-за чего иногода нчеловек неправильно рапсознает слово, принимая его за слово, в котором набор букв сходен

Вот именно - мне кажется, что здесь применим один из способов контекстного моделирования марковского источника при сжатии - PPM ( Prediction by Partial Match - предсказание по частичному совпадению ) - здесь можно будет решить проблему с сокращениями ( кстати о ней никто не вспомнил ) и орфографическими ошибками. Но это уже на том этапе, когда реализовано разделение слов на буквы. А как сделать последнее - не представляю. Только представил себе все возможные помехи и искаженя - аш голова закружилась.. Воистину - без артифисиал интелидженса не обойтись.

Y-Vladimir

Сообщ. #24 , 06.09.04, 12:29

Newbie

Профиль · PM

Рейтинг (т): 1

С сокращениями лекго справиться, поместив их в словарь, а с орфографическими ошибками - сделав нечеткий поиск по словарю. Так что это не проблема в практической реализации. Разделение слов на буквы мы тоже сделали, но этот алгоритм работает в тесном взаимодействии со всеми остальными (поиск по словарю, выделение траектории, сравнение траекторий), другого и не ожидалось, т.к. разделить слово на буквы не пользуясь больше инчем однозначно невозможно. Сейчас реализуем корректное выделение траетории, что очень не просто. Со сравнением траекторий вопрос тоже решен - найден неплохой алгоритм, мало зависящий от помех и неточностей написания.
Пок мы ограничились предположением, что рукописное слово написано средним почерком и неразрывно (т.е. слитно). Случаи плохого почерка пока не рассматриваем.

Gunnar

Сообщ. #25 , 06.09.04, 12:35

Senior Member

Профиль · PM

Рейтинг (т): 38

Цитата

Y-Vladimir, 6.09.04, 15:29
С сокращениями лекго справиться, поместив их в словарь

Все не предусмотришь.
Например слово количество моджет быть обозначено
количество
кол-во
к-во
кол.
колич.
итд...

И еще учитывай, что вместо тире и точки могут исп. др. знаки, или не быть вообще:
колво
кол/во
кол
кво
итд...

вобщем у каждого человека может быть собственный стиль сокращений. Сиситема, наделенная интелектом без проблем распознает это слово, а вот словарь...

Shirenin

Сообщ. #26 , 06.09.04, 20:49

Junior

Профиль · PM

Рейтинг (т): 1

Цитата

А можно поинтересоваться, к чему по вашему мнению нужно применять преобразование Фурье - к растровой матрице, к скелету, к траектории? И в каких случаях это может навредить?

Я вроде сообшал что этого делать не стоит. Навредить скорей всего не может, так же как и помочь.

Но если встает вопрос какой должен быть ввод в систему распознавания, то думаю, что мозги получают растр, а вот далее??? переводят его в векторную форму и потом последовательно применяют шаблоны, а впрочем может работают со скелетом, а может и с растром (думаю, что скорей всего в векторную форму, потом в растр, а потом работают с полученым растром). Тут дело в другом - факт(по крайней мере меня когда то так учили) что мозги работают по принципу сравнивания всего с шаблонами. Распознавания слова из букв не читая слова целиком - из той же оперы. Грустно в этом факте по крайней мере одно, если мозги могут натравить кучу шаблонов на полученый образ одновременно, то комп, увы, может проделать это только последовательно . Отсюда вывод : надо или идти другим путем, или пытаться оптимизировать данный алгоритм.

Y-Vladimir

Сообщ. #27 , 08.09.04, 07:41

Newbie

Профиль · PM

Рейтинг (т): 1

Цитата

Gunnar, 6.09.04, 15:35
Все не предусмотришь.
Например слово количество моджет быть обозначено
количество
кол-во
к-во
кол.
колич.
итд...

А всего и не надо, это в принципе проблема чито техническая, вообщем мелочи это, главное это алгоритм распознавания

OSokin	Сообщ. #28 , 29.09.04, 14:21
Unregistered	Имхо, нереально. У каждого человека свой подчерк

DUKe	Сообщ. #29 , 02.10.04, 19:26
Profi Профиль · PM Поощрения: 1 Dgm Рейтинг (т): 67	Вот, вы тут пишите невозможно, невозможно, а каждый день PocketPC текст от руки пишу слитно, не стараясь выводить буквы, а как обычно, и он меня прекрасно понимает (использую Transcriber оно MS'вское кажеться).

Shaman	Сообщ. #30 , 02.10.04, 22:07
Unregistered	Возможно, но сложно. На столько сложно, что в наших форумовских условиях - невозможно!

0 пользователей читают эту тему (0 гостей и 0 скрытых пользователей)

0 пользователей:

Страницы: (4) 1 [2] 3 4 все

[ Script execution time: 0,0387 ] [ 15 queries used ] [ Generated: 16.06.24, 10:32 GMT ]