Версия для печати
Нажмите сюда для просмотра этой темы в оригинальном формате
Форум на Исходниках.RU > Обсуждаем новые идеи > Обсуждение проекта BookScanLib


Автор: monday2000 14.11.06, 05:14
В этом топике, созданном в разделе флейма данного форума, можно обсудить любые общие вопросы относительно проекта BookScanLib - все детали, не относящиеся напрямую к программной реализации.

Топик по программной реализации проекта находится здесь:

Проект BookScanLib

Если у Вас есть такие материалы, как:

1. Исходные коды соответствующих алгоритмов на любом языке программирования.

2. Интернет-ссылки на перечисленное в п.1.

3. Интернет-ссылки на статьи о программировании растровой графики.

4. И прочие конкретные материалы по программной реализации.

- просьба сообщать о них в ветке Проект BookScanLib .

Здесь же мы можем обсудить всё остальное, что касается проекта BookScanLib, но при этом не подпадает под описание из 4 вышеуказанных пунктов.

Автор: Coala 14.11.06, 05:22
А ты уверен, что тут будут обсуждать ВСЁ ОСТАЛЬНОЕ? :)

Автор: monday2000 14.11.06, 05:25
Coala
Нет, я ни в чём не уверен на 100%. Но попробовать стоит. Если не получится - буду искать иной вариант - скорее всего, на другом Интернет-форуме. Особых причин быть именно на данном Интернет-форуме нет.

Автор: Nich 14.11.06, 08:04
Цитата monday2000 @
В этом топике, созданном в разделе флейма данного форума, можно обсудить любые общие вопросы относительно проекта BookScanLib - все детали, не относящиеся напрямую к программной реализации.

А почему в многошуме-то??? Есть специальный раздел для таких тем - Обсуждаем новые идеи

Автор: Coala 14.11.06, 08:10
Ага...и там почти такая же тема...Астарот придет и разберется :D

Автор: VovIKk 14.11.06, 15:35
Nich, Coala
Не напрягайтесь! :-)
Даный субьект (monday2000) мечется из форума на форум (только что пришел на этот форум - а уже угрожает уйти :huh: ), выдвигает какие-то идеи (больше похожие на проЖэкты), а сам мало чего делает реально, кроме того, что высказывает свои мысли вслух (а работать должен у него кто-то другой :o )

Автор: Астарот 14.11.06, 15:41
В Корзину? Не в Корзину? Блин, кто б помог определится... :unsure:

Автор: VovIKk 14.11.06, 15:45
Астарот
Цитата Астарот @
В Корзину? Не в Корзину? Блин, кто б помог определится...

Брось монетку :lol:

Автор: Green Light 14.11.06, 19:17
Цитата VovIKk @
Брось монетку :lol:

Random? :rolleyes:

Автор: glasspoint 14.11.06, 19:47
Цитата Астарот @
Блин, кто б помог определится...
Берешь пять пятикопеечных монеток, трясешь в кулаке, затем высыпаешь на стол. Если более трех из пяти лежат одинаковой стороной, то в корзину, иначе - до следующего раза. :P
ЗЫ: Счас попробовал поставить опыт, четыре монеты из пяти выпали модератором кверху, а пятую я потерял... :ph34r:

Автор: monday2000 15.11.06, 05:08
Привет, я в принципе в самом деле не знаю точно, угадал ли я верно с разделом форума, открывая данную конкретную ветку. Так что в случае чего прошу по-возможности перенести эту ветку в нужный раздел и мне это как-либо сообщить.

Если будете её прибивать - пожалуйста, напишите, почему - ну, просто интересно. ;)

Добавлено
VovIKk
Привет, спасибо за рекламу. :) Это моему проекту тоже пригодится. ;)

Автор: monday2000 15.11.06, 07:12
Nich
Цитата
А почему в многошуме-то??? Есть специальный раздел для таких тем - Обсуждаем новые идеи

Ну, собственно, чтобы иметь полную свободу. Обычно во флеймовых разделах форума можно обсудить всё, что хочешь - имеется ли такая свобода в "Обсуждаем новые идеи"?

Если да - модераторы, перенесите, пожалуйста, туда данный топик.
Coala
Цитата
Ага...и там почти такая же тема...Астарот придет и разберется

Не, это задумано по смыслу как 2 разных топика - там говорим только по делу, а тут можно пофлеймить - чтобы там проект флудом не заливало уж слишком. :) Например, в рамках своего проекта я использую некоторые организационные приёмы - вряд ли логично это обсуждать в том же месте, где будут обсуждаться исходники алгоритмов. И я не вполне уверен, что такое можно обсудить в "Обсуждаем новые идеи" - если можно - прекрасно, давайте туда перенесём данный топик. Про флеймовый-то раздел форума ясно, что тут всё можно обсудить.

Если я что-либо сильно тут нарушаю - нет проблем, могу на более "заточенный" какой-нибудь форум уйти. Совместная разработка некоей открытой программы - это обычная мировая практика. Другое дело, что я мог ошибочно выбрать форум для этой цели - именно в этом случае я готов избавить всех от лишних хлопот и перейти на некий более специализированный форум - я просто такие форумы сильно и не искал (а мне нужен именно русскоязычный форум), выбрал первый попавшийся, вроде бы на вид подходящий.

Автор: monday2000 15.11.06, 07:46
Я практически уверен в успехе своего проекта. Вот мои доводы:

1. Если что - я всё сделаю сам.

2. Сама по себе задача вообще-то довольно технически проста. Есть куча вспомогательных материалов для её выполнения. Общая проблематика хорошо проработана и известна.

3. В сущности, я нисколько не делаю ставку на существующих участников данного форума. Основную ставку я делаю на привлечение на этот форум новых людей - из числа тех, кто умеет немного программировать, а также давно и в больших количествах сканирует бумажные книги. Таковых людей немало. Привлекать я их рассчитываю за счёт своего сайта http://www.djvu-soft.narod.ru/ - ресурса, достаточно известного в кругах книгосканировщиков.

Однако, я хочу поблагодарить местных уже существующих участников форума. Я даже не ожидал такого интереса и внимания с их стороны к моему проекту - это очень приятная неожиданность, спасибо.

Я, в общем-то, хотел бы надеяться на доброжелательность участников форума и на снисходительность местных модераторов - мой проект - дело новое для меня - естественно, возможны всяческие чисто организационные проблемы и перегибы.

В конце концов, я своим проектом выражаю интересы практически всех российских программистов - известно, что каждый программист нуждается буквально в десятках учебников по программированию - разве мыслимо их все покупать за деньги? Я же пытаюсь развивать существующую технологию сверхдешёвого создания электронных копий бумажных книг - что по замыслу в случае успеха ЗНАЧИТЕЛЬНО облегчит жизнь каждому программисту - за счёт радикального упрощения технологии создания эл. копий бум. книг (важно учитывать при этом, что люди потом друг с другом бесплатно обмениваются такими эл. книгами через Интернет).

Автор: monday2000 20.11.06, 09:35
Некоторые важные замечания по общей стратегии:

Общий ход развития проекта мне представляется так:

1. Учебный этап.

На этом этапе необходимо сделать следующее:

А. Создать учебные программные реализации всех алгоритмов, перечисленных в http://www.djvu-soft.narod.ru/bookscanlib/002.htm в рамках Единой Платформы (ЕП описана на http://www.djvu-soft.narod.ru/bookscanlib/ в п. "Соглашения проекта"). Обратите внимание - речь идёт именно об учебных, т.ск. "классических" реализациях алгоритмов, а не об их "профессиональных" реализациях.

Б. Написать немалое количество онлайн-документации в виде статей на русском языке в формате HTM, подробно раскрывающей суть учебных алгоритмов и общую проблематику по работе с растровой графикой.

Суть учебного этапа в том, чтобы "привести к общему знаменателю" многочисленные, но довольно разрозненные материалы по теме. В ряде случаев будет достаточно просто взять чью-либо открытую реализацию подходящего алгоритма, разобраться в том, как она работает, и переделать её под Единую Платформу, сопроводив всё это хорошей документацией.

Я думаю - не стоит прямо сейчас пытаться создать "настоящие" "крутые" алгоритмы сканобработки - сначала нужно "раскрыть" всю проблематику для общественности, дать людям возможность просто разобраться во всём этом, т.е. сделать своего рода "общий обзор".

2. Рабочий этап.

Только пройдя Учебный этап, следует браться за, собственно, разработку итоговых "профессиональных" алгоритмов - хотя бы потому, что многие "профессиональные" алгоритмы "завязаны" друг на друга - скажем, хороший Deskew обязательно должен использовать элементы Segmentation - иначе Deskew будет сбиваться на картинках (как СканКромсатор в настоящее время).

После выполнения Учебного этапа (это где-то 1 год примерно) я надеюсь, что появится от 5 до 15 человек, которые будут иметь у себя в голове хорошие обзорные знания по всей проблематике, что и позволит всерьёз заняться "профессиональными" реализациями алгоритмов.

Даже если удастся выполнить только лишь первый - Учебный - этап, всё равно можно будет считать задачу проекта выполненной - "привлечение внимания общественности к проблематике сканобработки" и "создание почвы для разработки профессиональных алгоритмов". Ведь пока что имеется лишь россыпь случайной информации - как минимум, нужно всё это "переварить", осмыслить, и наметить перспективы (задача Учебного этапа).

В первые месяцы разворачивания проекта скорее всего, я буду над ним работать в одиночку. По мере развития проекта ожидается присоединение новых реальных участников. Я не смогу заходить на этот форум слишком часто (т.к. на всё требуется время) - так что если тут целыми неделями не будут появляться новые сообщения, это вовсе не будет означать, что проект заброшен.

Пока что я могу всем посоветовать следующее: читайте статьи, литературу (список я дал), изучайте FreeImage и исходники чужих алгоритмов, попробуйте сделать в простейшем "учебном" виде какой-либо алгоритм из списка на http://www.djvu-soft.narod.ru/bookscanlib/002.htm (желательно в рамках Единой Платформы). Ещё по желанию можете написать какую-либо полезную статью по программной работе с растровой графикой.

Автор: monday2000 20.11.06, 12:05
В данном форуме имеется возможность прикрепить свой файл к сообщению. Эту крайне полезную возможность можно использовать для размещения в рабочем топике Проект BookScanLib как Rar-архивов с листингами алгоритмов, так и для собственных статей в формате HTM (запакованных в Rar тот же например). Как прикрепить файл к посту - см. Помощь. Лимит - 200 КБ, что для заархивированного файла довольно хороший показатель - надеюсь, этого хватит для листингов большинства алгоритмов и текстов статей.

Если кто-нибудь может предложить более лучший вариант для публикации пользовательских статей (по теме проекта) - буду признателен. (То есть, вопрос в том, где в Интернете можно размещать именно свои статьи, а не посты. Возможные варианты: некий удобный блог или же какой-либо приемлемый сайт-коллектор статей - кто знает, подскажите, пожалуйста).

Автор: Romtek 23.11.06, 13:44
Я, возможно, невнимательно прочитал, но так и не понял, какова главная задача этого проекта:
подготовка к приемлемому для чтения формату DJVU (обработка изображения с помощью фильтров) или же создание аналога FineReader'у, т.е. OCR, что сложнее первого?

Цитата monday2000 @
Если кто-нибудь может предложить более лучший вариант для публикации пользовательских статей (по теме проекта) - буду признателен. (То есть, вопрос в том, где в Интернете можно размещать именно свои статьи, а не посты. Возможные варианты: некий удобный блог или же какой-либо приемлемый сайт-коллектор статей - кто знает, подскажите, пожалуйста).

Могу предложить гибкую систему на основе движка DokuWiki, очень подходит для такого рода деятельности. Если желаешь, можешь зарегистрировать свой проект у нас в Коллективных Проектах Исходников (смотри ссылку Wiki вверху) и я помогу с его размещением.

Автор: wormball 23.11.06, 14:00
Цитата Romtek @
Я, возможно, невнимательно прочитал, но так и не понял, какова главная задача этого проекта:
подготовка к приемлемому для чтения формату DJVU (обработка изображения с помощью фильтров) или же создание аналога FineReader'у, т.е. OCR, что сложнее первого?

Судя по всему, автор на свой файнридер замахнулся.

Лично я бы на месте автора задумался бы над распознаванием не отсканированного текста (на эту тему и так куча народу думает), а отфотографированного. Ибо так скорость оцифровки очень сильно повышается. Для начала, например, сделать приведение текста к прямоугольному виду и выравнивание яркости/контраста по всему изображению.

Автор: Romtek 23.11.06, 15:21
У этого проекта предвижу проблемы с авторством.

Автор: wormball 23.11.06, 16:17
Скорее не с авторством, а с реализацией.

Автор: monday2000 11.12.06, 09:26
Здраствуйте, я прошу прощения за то, что не слишком часто заглядываю на этот форум. Сейчас дочитываю книжку Айриг С., Айриг Э. «Подготовка цифровых изображений для печати» http://www.djvu-soft.narod.ru/bookscanlib/002.htm . Я работаю над проектом, точно не брошу его, чего бы мне это ни стоило. В планах: рассмотреть алгоритм Rotate из FreeImage, написать об этом статью, а затем взяться за Deskew (т.к. Deskew основан на Rotate).

Romtek
Цитата
Я, возможно, невнимательно прочитал, но так и не понял, какова главная задача этого проекта

Частично и то, и другое. У Вас есть дома сканер? Весьма желательно его иметь всем заинтересовавшимся.
Если мы говорим об электронных версиях бумажных книг, то здесь есть 2 мира: мир DjVu/Pdf и мир OCR (оплот мира OCR - lib.ru). Я предлагаю развивать 1-ый - 2-ой уже и так развит. Знаете проект Google Print? Почитайте - http://lenta.ru/internet/2004/12/14/google/ .
Чтобы понять суть данного проекта - ещё раз перечитайте "2. Ликбез по теории и алгоритмам обработки сканов книг" на http://www.djvu-soft.narod.ru/bookscanlib/002.htm .
Цитата
Если желаешь, можешь зарегистрировать свой проект у нас в Коллективных Проектах Исходников (смотри ссылку Wiki вверху) и я помогу с его размещением.

Спасибо, но пока это слишком для меня сложно. Потом - посмотрим, не всё сразу, силы-то небезграничны.
wormball
Цитата
Лично я бы на месте автора задумался бы над распознаванием не отсканированного текста (на эту тему и так куча народу думает), а отфотографированного.

Спасибо, но я пока всё сразу не потяну - пока буду делать то, что умею, а дальше посмотрим. А Вы не хотите ли подключиться и эту свою идею реализовать?

Мне хотелось бы, чтобы данный проект обрёл истинно народный характер. Я лишь дал идею, простейшую организационную структуру, и взял на себя неприятную обязанность отвечать за успешность. Поэтму - если можете - примите участие в проекте - в любой форме, не нарушающей общественного порядка на форуме. Пусть это проект на первых порах будет как общий котёл, куда все будут нечто своё вкладывать. Всё это потом "переплавится" и даст свой эффект.

Ещё я надеюсь - может быть, кто-то начнёт параллельный проект, аналогичный данному? Было бы замечательно - будем помогать друг другу. Вовсе не факт, что я всё наилучшим образом тут продумал - если кто-то запустит свой более здравый и разумный проект - превосходно. Может быть, Вы захотите под Unix сделать аналогичный проект, или т.п. - в один проект (мой) это никак не втиснешь.

Автор: monday2000 12.12.06, 09:31
Я посмотрел страницу http://www.sources.ru/wiki/doku.php - Коллективные Проекты Исходников (КПИ).

К сожалению, мне пока не понравилось. Это просто не самая удачная попытка подражательства модным буржуйским веяниям (вроде Sourceforge) - но далеко не оптимальная организационная структура для проекта BookScanLib.

Конечно, хочется пожелать разделу КПИ всяческого развития. Но пока я вынужден сделать неутешительный вывод: раздел КПИ - слишком сложен для "чайников", он, несомненно, лишь отпугнёт людей этим. А проект BookScanLib озадачен именно привлечением и обучением (что немаловажно) чайников, а не "спецов". Я вижу свою задачу в том, чтобы "разжевать" предмет любому чайнику до такой степени, когда программирование алгоритмов сканобработки покажется ему простым и лёгким занятием. Именно "чайники" - социальная база проекта BookScanLib, а вот у раздела КПИ - социальная база - "спецы-программисты". Вот вам и разница.

Я выстраиваю несравненно более простую и понятную любому чайнику организационную структуру - "мой сайт + 2 топика". Всё! Просто и понятно - любому чайнику, не надо ни во что вникать. Опыт показывает - люди ленивы и не верят в свои силы (это самое страшное, на эту тему читайте мою статью "Гуманитарные задачи проекта BookScanLib" http://www.djvu-soft.narod.ru/bookscanlib/human.htm ) - никто никогда не будет в массовом порядке участвовать в структурах вроде КПИ - разве что единичные профессионалы.

У меня есть опыт 2-х летнего администрирования своего сайта http://www.djvu-soft.narod.ru/ + такой же опыт работы в Интернет-форумах - поэтому у меня имеется хорошеее практическое представление "как всё будет" и "как лучше сделать". Именно поэтому я затеял проект BookScanLib - иначе я бы никогда не решился на столь ответственный шаг.

Я предлагаю вот что: пусть чуть ли не каждый будущий участник проекта BookScanLib создаст свой пользовательский сайт, допустим на Narod.ru. Это довольно просто делается. И тогда уже каждый сможет публиковать на таком сайте все плоды своих будущих трудов. Это более удобно и гибко, чем КПИ. Кроме того - проекту BookScanLib не стОит попадать в зависимость от любого, самого распрекрасного Интернет-форума - чтобы никто никогда не смог разговаривать с проектом BookScanLib с позиции силы (а соблазн такой почему-то возникает нередко у них).

Автор: Romtek 12.12.06, 09:35
Цитата monday2000 @
раздел КПИ - слишком сложен для "чайников", он, несомненно, лишь отпугнёт людей этим.
:( Ладно, не буду навязывать своё мнение.

Давай лучше про саму обработку. Допустим, обработал я неким фильтром отсканированное изображение, переведя его в бинарное. Что дальше?

Добавлено
Цитата monday2000 @
читайте мою статью "Гуманитарные задачи проекта BookScanLib" http://www.djvu-soft.narod.ru/bookscanlib/human.htm
Ой, воды налил то сколько... :o Покороче нельзя? Это ведь не мемуар.

Автор: glasspoint 12.12.06, 13:31
Цитата Romtek @
Покороче нельзя? Это ведь не мемуар.
Тебе ж сказано:

Цитата monday2000 @
А проект BookScanLib озадачен именно привлечением и обучением (что немаловажно) чайников, а не "спецов". Я вижу свою задачу в том, чтобы "разжевать" предмет любому чайнику до такой степени, когда программирование алгоритмов сканобработки покажется ему простым и лёгким занятием. Именно "чайники" - социальная база проекта BookScanLib, а вот у раздела КПИ - социальная база - "спецы-программисты". Вот вам и разница.
:lool: А ты сразу "Ну и в чем тут ТЗ?" А тут не ТЗ, а проповеди во имя всеблагого Файнридера. :P

Автор: Romtek 18.12.06, 14:25
Цитата monday2000
Я написал новую статью:

3. Памятка участникам проекта BookScanLib.

http://www.djvu-soft.narod.ru/bookscanlib/003.htm

Эта памятку я написал для всех тех, кто заинтересовался проектом BookScanLib, и хотел бы в нём как-либо поучаствовать, но не знает с чего начать и что, собственно, делать.

Прочитав, вкратце перескажу что я извлёк из сказанного:
желательно иметь опыт программирования на С++, ииеть знания в обработке изображнений алгоритмами, писать документацию по алгоритмам.
Я не говорю про компьютер, подключённый к интернету и сканер... :P

Автор: n0p 18.12.06, 19:10
прививать культуру любви к Си и С++ и оpen-sources необходимо вместе с той культорой откуда это и началось - Linux. По мне нехватает цикла статей подобных 'Гуманитарным задачам' - навроде 'Linux - твоя свобода'. 'Свободный проект - в свободной ОСи'.


Извините, но предлагать купить на толкучке за бакс-два-три проприетарные системы и средства разработки.. Извините, это уровень Остапа Бендера, но не как Гиганта Мысли. 'чайнег' прежде всего должен научиться мыслить в нужном направлении, чтоб потом вся эта 'многопроцессорная' система 'работала' и приносила свои плоды.

тем более что Linux - по сути таже Developer Studio. Только под GCC, тот же самый С/C++ компилер уже встроеный в систему.

Автор: monday2000 28.12.06, 11:03
Romtek
Цитата
Ой, воды налил то сколько... Покороче нельзя? Это ведь не мемуар.

Нет, нельзя. :) Это называется "комплексный подход", и эта "вода" рассчитана на не-программистов, желающих поучаствовать. Если будем делать "проще" - не-программисты к нам не пойдут...
Цитата
Давай лучше про саму обработку.

После новогодних каникул сделаю и выложу большую статью о растровой графике. Сырьё уже набрал - десятки метров текстов.
Цитата
Допустим, обработал я неким фильтром отсканированное изображение, переведя его в бинарное. Что дальше?

Подробнее см. тут: http://www.djvu-soft.narod.ru/bookscanlib/002.htm - там схематически весь процесс объяснён на пальцах. Могу ещё вот что посоветовать: если имеете сканер - попробуйте отсканировать одну книгу и сделать из неё электронную - чисто на пробу - тогда многое станет ясным.
n0p
Цитата
Извините, но предлагать купить на толкучке за бакс-два-три проприетарные системы и средства разработки.. Извините, это уровень Остапа Бендера, но не как Гиганта Мысли.

Это называется "што могём". :) Я смотрю на вопрос с сугубо практической точки зрения - как сделать так, чтобы чайники реально смогли поучаствовать. Ведь качать компиляторы из Сети и настраивать их чайник совершенно точно не станет. Да и вообще - начинать надо с чего-то простого - лишь потом можно будет начать усложнять - по мере необходимости.

P.S. Важный момент: я не вижу ничего зазорного в понятии "чайник". Все мы в чём-то "чайники". А быть чайником, желающим чему-то научиться - ИМХО почётно и правильно.

Всех с Новым Годом! Встретимся тут уже после 9 января. 8-)

Автор: inyanov 16.01.07, 13:47
Может быть, стоит подумать на тему программной оболочки? Иначе можно получить тот же Кромсатор как некий набор “магических” действий, понятных только автору и тем кто “долго мучался”. Программная оболочка может стать структурой для кода как www.djvu-soft.narod.ru/bookscanlib стал структурой для знаний и информации. К тому же проект станет реально открыт не только для энтузиастов, но и для тех, кто хочет подзаработать, написав какой-нибудь фильтр. Многообразие из “точки” всегда на пользу делу, плюс появляется конкуренция.
Первое заблуждение появилась от MS - существует одна универсальная программа и много расширений (данных). Отсюда огромное кол-во, выскакивающих по-делу и без, окон. В жизни скорее все наоборот – файл данных один, а обрабатывающих программ много. И выглядеть это должно как одно окно с данными, но меняющимся шельфом. Оба подхода должны быть равнодоступны.
Как организовать подключения сторонних plug-in были статьи в “Программисте”.
Хороший пример проигрыватель fb2к. От блокнота до “пепелаца”.
В хороших приборах есть несколько режимов. Первый, для Z-пользователей – все выставляется автоматически, чтобы получить хоть какой-то результат (по умолчанию). Второй, для поднаторевших – возможность менять параметры. Третий, – возможность устанавливать и конфигурировать фильтры и преобразователи (последовательно, параллельно, ветвлением и суммированием), создавать свои пресеты для разных ситуаций.
От интерактивности тоже не стоит отказываться. Машина не бог, а ситуации бывают разные. Кромсатор в этом смысле очень не плох.
О структурах. Программа мало, чем отличается от завода. Склад, цех, бухгалтерия – горизонтальные связи, менеджмент – вертикальные связи. Остается только его построить.

Автор: monday2000 22.01.07, 05:03
inyanov
Цитата
Может быть, стоит подумать на тему программной оболочки? Иначе можно получить тот же Кромсатор как некий набор “магических” действий, понятных только автору и тем кто “долго мучался”.

Что конкретно Вы имеете в виду?
Пока что нет нужных алгоритмов - так что программную оболочку просто некуда "привешивать".
Цитата
кто хочет подзаработать, написав какой-нибудь фильтр.

Проблемы "коммерсантов" меня не интересуют - они уж как-нибудь и без нас обойдутся. :) Данный проект строго некоммерческий.

Автор: Y-Vladimir 28.01.07, 09:11
Привет всем!

Я тоже занимаюсь практически аналогичным проектом. Многие из тех задач, что вы поставили я уже сделал (насколько качественно, это другой вопрос).
В частности сейчас занимаюсь сегментацией - отделением текста от рисунков, на отсканированном изображении страницы.

Цитата (monday2000 @ 14.11.06, 08:34)
Segmentation - алгоритм сегментации. Суть: автоматическое определение воображаемого прямоугольного контура, очерчивающего изображение строк текста на скане. Метод: распознавание образов. Как именно это сделать - пока неясно. Предположительно - нейросети, но это пока лишь гипотеза.

Вот ссылки на обсуждение (там же есть ссылка на тестовую прогу, что я сделал для сегментации):
http://forum.rsdn.ru/Forum/Message.aspx?mid=2300983
Отделение текста от рисунков

Автор: monday2000 29.01.07, 05:09
Y-Vladimir
Ответил Вам тут:
Проект BookScanLib

P.S.
Я увидел Вашу статью: http://old-book.ksu.ru/info.php . Так Вы хотите использовать бытовой цифровой фотоаппарат для оцифровки бум. книг? Это практически невозможно - бытовые цифровые фотоаппараты совершенно не подходят для этой цели - вопрос не раз обсуждался в широких кругах. Возникают проблемы с фокусировкой, экспозицией, неравномерностью освещения, геометрическими искажениями, а также быстро изнашивается затвор фотоаппарата, да и вообще - качество цифровой копии получается низкое - малое разрешение. Всех этих проблем начисто лишён обычный сканер.
Таким образом, альтернативы бытовому сканеру просто нет. Лучше купите A3-сканер за 5 тыс. рублей и им сканируйте - ц. фотоаппаратом абсолютно нереально - намучаетесь с ним изрядно, а толку не будет - цифровые копии (в массовом масштабе если) будут получаться совершенно неприемлемого качества.

Автор: wormball 30.01.07, 16:40
Цитата monday2000 @
Так Вы хотите использовать бытовой цифровой фотоаппарат для оцифровки бум. книг? Это практически невозможно - бытовые цифровые фотоаппараты совершенно не подходят для этой цели - вопрос не раз обсуждался в широких кругах.

А по-моему - так в самый раз. Затрачиваемое время сокращается в десятки раз.

Цитата monday2000 @
Возникают проблемы с фокусировкой, экспозицией, неравномерностью освещения, геометрическими искажениями, а также быстро изнашивается затвор фотоаппарата, да и вообще - качество цифровой копии получается низкое - малое разрешение.

Ежели грамотно закрепить и грамотно подобрать свет (что, кстати, не так уж сложно) - будет самое оно. Особенно если речь идёт об оцифорвке большого числа страниц в день. Затвор изнашивается, но сканер тоже изнашивается. Если затвор сломается, скажем, через 100 тысяч снимков, а одна страница сканируется пусть даже минуту, то это эквивалентно 69 суткам непрерывного сканирования или 208 8-часовым рабочим дням. Если принять, что страница фотографируется за 10 секунд (вместе с процессом переворачивания), то тот же объём можно отснять за 35 рабочих дней. Думаю, заплатить 10 тысяч рублей (Canon A640) за почти год сэкономленного времени - не очень большой расход. Да и сканер за такое время неоднократно успеет сломаться. Малое разрешение - думаю, 10 мегапикселей хватит, в крайнем случае можно снимать не по две, а по одной странице. Фокусировка - есть такая вещь, как ручной фокус.

Кстати говоря, у фотоаппаратов гарантия 2 года, можно заюзать его по самое не хочу, а потом с невинными глазами прийти в сервис, где тебе его абсолютно бесплатно починят. Ибо про количество снимков в гарантии не говорится ни слова.

Автор: monday2000 12.02.07, 05:19
wormball
А Вы реально пробовали фотографировать книгу? Как получилось - нормально качество конечного DjVu-файла? Я ещё не успел так попробовать, честно говоря - сужу по чужим описаниям - см. http://www.abbyy.ru/finereader/forum/actualthread.aspx?bid=10&tid=64&pg=-1#last (там можем этот вопрос обсудить детально).

В идеале сделайте, пожалуйста, по возможности статью о фотографировании книг цифровиком, аналогичную моей статье:

Описание покупки сканера (январь 2007)
http://www.djvu-soft.narod.ru/scan/buy_scanner_2007.htm .

Powered by Invision Power Board (https://www.invisionboard.com)
© Invision Power Services (https://www.invisionpower.com)