На главную Наши проекты:
Журнал   ·   Discuz!ML   ·   Wiki   ·   DRKB   ·   Помощь проекту
ПРАВИЛА FAQ Помощь Участники Календарь Избранное RSS
msm.ru
Страницы: (4) 1 [2] 3 4  все  ( Перейти к последнему сообщению )  
> Система распознавания рукописного текста , Реально или нет?
    Трансформ Фурье хорошо подходит.

    Например его можно использывать для распознавания принадлежности подчерка то или иному человеку, для распознавания художников, и т.п

    вполне возможно он и тут подойдет, но перед этим надо как то разделить слова на буквы
      Цитата
      esperanto, 3.09.04, 10:11
      Трансформ Фурье хорошо подходит.

      Например его можно использывать для распознавания принадлежности подчерка то или иному человеку, для распознавания художников, и т.п

      вполне возможно он и тут подойдет, но перед этим надо как то разделить слова на буквы

      Не думаю, что это хороший подход, таким способом можно определять стили почерка, классы, но распознавать рукописный текст с приемлемым качесвтом - нет. Главная трудность - специфические искажения, которые возникают при рукописном письме, о чем я писал выше (самопересечение линий, букв, и т.д.). Вот поэтому напрямую этот способ использовать нельзя. Другое дело, когда мы знаем траекторий написния слова, вот тогда к этой траектории можно применить он-лайн методы, в частности сравнение траекторий с использованием FFT. Но выделение траекторий очень сложная задача, для которой до сих пор нет хорошего решения, но это ИМХО самый верный и качественный путь.

      Один из методов сравнения траекторий здесь
      Сообщение отредактировано: Y-Vladimir -
        :wall: да искажения возникают, но отсюда не ясно что метод использывать нельзя.

        каковы доминирующие частоты искажений, каков спекрт.

        может быть обнаружить в спектральной плоскости искажения будет проще, а следовательно можно будет уменьшить их влияние.

        имхо надо проверять практикой.
          Характер искажений другой - это отклонения в траетории в процессе написания, из-за чего и возникают самопересечения линий и букв, на растровой матрице этого не исправишь, только на траектории, поэтому сначала нужно выделить траекторию, а потом уже можно фильтровать частотные составаляющие
            esperanto ,
            1. Не даром почти во всех языках слова разделяются пробелами. Рукописный текст проще разбивать по словам.
            2. Думаю, что распознавалка, встроенная в человека не мелочится на буквы... Точнее, со временем, обучившись, перестаёт мелочится, распознавая буквы. Думаю, что многие замечали это при чтении.

            Таким образом, самый подходящий способ для рукописной распознавалки - итеративное распознавание слов целиком.
            Например, слово "Интеллектуальный" имеет массу вариаций, связанных с падежами, родами и т.п.. Надеюсь, что Фурье преобразование сможет подвести нас к подмножеству слов с этим корнем. А дальше - дело техники. Естественно, что такой подход потребует коллосальной базы знаний... а, может быть, можно создать алгоритм, что-то вроде кэш-функций для слов с одинаковым корнем, который позволит связать импульсы Фурье с определёнными вариациями слова... :rolleyes:

            Мдя... Сюдабы примеры кода уже существующих реализаций! Да мы! Да я! Я бы тут... Ух! :lol:
              2. Думаю, что распознавалка, встроенная в человека не мелочится на буквы... Точнее, со временем, обучившись, перестаёт мелочится, распознавая буквы. Думаю, что многие замечали это при чтении.

              Скорей всего это неверно. Просто пока идет процесс накопления знаний - образ не хранится в той доли мозга которая отвечает за шаблоны соответствия зрительных образов(скорей всего хранится и накапливается, но матрица помечена как "не рабочая пока"). Когда же они туда попадают, человеку не требуется привлекать процессы, связанные с сознанием, для понимания буквы - таким образом, задумываться над буквой человеку не требуется.

              Первый факт так же скорей всего не дает пользы(неверен вывод по поводу пробелов).

              Преобразование фурье в данной ситуации может как помочь так и навредить - дело почерка. Современные системы распознавания основаны как я знаю - на базе нейронных сетей. Когда то пробовались системы фильтрующии для начала буквы по количеству самопересечений. Вобщем сложно все это ... кол-во книг посвященных этой теме этот факт подтверждает (может стоит их почитать раз тема интересует).
                Вопрос

                Добавлено в :
                <...Преобразование фурье в данной ситуации может как помочь так и навредить - дело почерка...>
                А можно поинтересоваться, к чему по вашему мнению нужно применять преобразование Фурье - к растровой матрице, к скелету, к траектории? И в каких случаях это может навредить?

                Добавлено в :
                <...2. Думаю, что распознавалка, встроенная в человека не мелочится на буквы... Точнее, со временем, обучившись, перестаёт мелочится, распознавая буквы. Думаю, что многие замечали это при чтении....>
                Не совсем. Человек со временем перестает распознавать окончания, он просто восстанавливает их по контексту. В доказательство этому можно привести факт, что прибыстром чтении человек не обращает внимение на некоторую несогласованность окончаний, и даже на перестановки букв в словах, из-за чего иногода нчеловек неправильно рапсознает слово, принимая его за слово, в котором набор букв сходен. Особенно это заметно при быстром чтении
                  Цитата
                  Y-Vladimir, 6.09.04, 14:47
                  из-за чего иногода нчеловек неправильно рапсознает слово, принимая его за слово, в котором набор букв сходен


                  Вот именно - мне кажется, что здесь применим один из способов контекстного моделирования марковского источника при сжатии - PPM ( Prediction by Partial Match - предсказание по частичному совпадению ) - здесь можно будет решить проблему с сокращениями ( кстати о ней никто не вспомнил ) и орфографическими ошибками. Но это уже на том этапе, когда реализовано разделение слов на буквы. А как сделать последнее - не представляю. Только представил себе все возможные помехи и искаженя - аш голова закружилась.. Воистину - без артифисиал интелидженса не обойтись.
                    С сокращениями лекго справиться, поместив их в словарь, а с орфографическими ошибками - сделав нечеткий поиск по словарю. Так что это не проблема в практической реализации. Разделение слов на буквы мы тоже сделали, но этот алгоритм работает в тесном взаимодействии со всеми остальными (поиск по словарю, выделение траектории, сравнение траекторий), другого и не ожидалось, т.к. разделить слово на буквы не пользуясь больше инчем однозначно невозможно. Сейчас реализуем корректное выделение траетории, что очень не просто. Со сравнением траекторий вопрос тоже решен - найден неплохой алгоритм, мало зависящий от помех и неточностей написания.
                    Пок мы ограничились предположением, что рукописное слово написано средним почерком и неразрывно (т.е. слитно). Случаи плохого почерка пока не рассматриваем.
                      Цитата
                      Y-Vladimir, 6.09.04, 15:29
                      С сокращениями лекго справиться, поместив их в словарь

                      Все не предусмотришь.
                      Например слово количество моджет быть обозначено
                      количество
                      кол-во
                      к-во
                      кол.
                      колич.
                      итд...

                      И еще учитывай, что вместо тире и точки могут исп. др. знаки, или не быть вообще:
                      колво
                      кол/во
                      кол
                      кво
                      итд...

                      вобщем у каждого человека может быть собственный стиль сокращений. Сиситема, наделенная интелектом без проблем распознает это слово, а вот словарь...
                        Цитата

                        А можно поинтересоваться, к чему по вашему мнению нужно применять преобразование Фурье - к растровой матрице, к скелету, к траектории? И в каких случаях это может навредить?


                        Я вроде сообшал что этого делать не стоит. Навредить скорей всего не может, так же как и помочь.

                        Но если встает вопрос какой должен быть ввод в систему распознавания, то думаю, что мозги получают растр, а вот далее??? переводят его в векторную форму и потом последовательно применяют шаблоны, а впрочем может работают со скелетом, а может и с растром (думаю, что скорей всего в векторную форму, потом в растр, а потом работают с полученым растром). Тут дело в другом - факт(по крайней мере меня когда то так учили) что мозги работают по принципу сравнивания всего с шаблонами. Распознавания слова из букв не читая слова целиком - из той же оперы. Грустно в этом факте по крайней мере одно, если мозги могут натравить кучу шаблонов на полученый образ одновременно, то комп, увы, может проделать это только последовательно . Отсюда вывод : надо или идти другим путем, или пытаться оптимизировать данный алгоритм.
                          Цитата
                          Gunnar, 6.09.04, 15:35
                          Все не предусмотришь.
                          Например слово количество моджет быть обозначено
                          количество
                          кол-во
                          к-во
                          кол.
                          колич.
                          итд...

                          А всего и не надо, это в принципе проблема чито техническая, вообщем мелочи это, главное это алгоритм распознавания
                            Имхо, нереально. У каждого человека свой подчерк
                              Вот, вы тут пишите невозможно, невозможно, а каждый день PocketPC текст от руки пишу слитно, не стараясь выводить буквы, а как обычно, и он меня прекрасно понимает (использую Transcriber оно MS'вское кажеться).
                                Возможно, но сложно. На столько сложно, что в наших форумовских условиях - невозможно!
                                :tong:
                                0 пользователей читают эту тему (0 гостей и 0 скрытых пользователей)
                                0 пользователей:
                                Страницы: (4) 1 [2] 3 4  все


                                Рейтинг@Mail.ru
                                [ Script execution time: 0,0387 ]   [ 15 queries used ]   [ Generated: 16.06.24, 10:32 GMT ]