Версия для печати
Нажмите сюда для просмотра этой темы в оригинальном формате
Форум на Исходниках.RU > Обсуждаем новые идеи > Проект по распознаванию чеков


Автор: sploid 03.04.14, 07:39
Привет всем.

Я хочу реализовать проект по распознаванию магазинных чеков, но большие проблемы со временем.
У меня есть некоторый опыт в обработке изображений и мне кажется, что проект с чеками можно реализовать.
Мой опыт на С++ более 10 лет, могу подтянуть плюсы у новичков.
Пока непонятен алгоритм монетизации проекта и вообще непонятно выгорит ли он.
Если кому-то интересно поучаствовать в проекте, пишите.

В работе будут использоваться:
С++, OpenCV, Qt, tesseract

Автор: Kosha 03.04.14, 09:58
А зачем распознавать магазинные чеки?

Автор: Мяут-Настоящий 03.04.14, 11:01
Ты понесешь чек к ноуту чтобы распознать его? Или все-таки скормишь Google Googgles на смартфоне?

Ну и +1 к вопросу Kosha.

Автор: sploid 03.04.14, 11:29
Цитата
А зачем распознавать магазинные чеки?


Распознавание чеков достаточно востребованная фича при ведении личной бухгалтерии.
Можно интегрировать в такие проекты:
http://www.gnucash.org/
drebedengi.ru - разговаривал с этими ребятами, сказали что востребованная фича и у них есть АПИ для интеграции, поэтому, для начала, можно к ним вкорячить.

Добавлено
Цитата
Ты понесешь чек к ноуту чтобы распознать его? Или все-таки скормишь Google Googgles на смартфоне?


Человек фоткает чек с телефона и он распознается.
Далее этот чек можно будет добавить в какую-нибудь приложеньку учета финансов.
Пока будет версия для ПК, но под Андройд полюбому надо будет потом пилить.

Я хочу сделать сервис для распознавания чеков, а не приложение для учета личных финансов.

Добавлено
Этапы разработки:
1. Поворот чека - сделал
2. Разделение на строки - в процессе
3. Распознавание текста (tesseract)
4. Допил tesseract что бы можно было легко обучать новым символам и оставить только нужные символы
5. Обработка текста (поиск товаров, что за чек и т.п.)
6. Написать программу что бы пользователь сам мог обучить распоновалку своему чеку

Автор: Павел Калугин 03.04.14, 11:51
Цитата sploid @
Распознавание чеков достаточно востребованная фича при ведении личной бухгалтерии.

При обязательном условии точного определения товара. Иначе - это будет мусор мало пригодный к использованию

Автор: sploid 03.04.14, 11:57
Цитата Павел Калугин @
Цитата sploid @
Распознавание чеков достаточно востребованная фича при ведении личной бухгалтерии.

При обязательном условии точного определения товара. Иначе - это будет мусор мало пригодный к использованию

Скорее надо определить не сам товар, а Категорию, к которой относится данный товар.
Обычно пользователи разбирают не картошка, хлеб, а продукты, оплата телефона, хоз. товары.

Автор: Павел Калугин 03.04.14, 12:33
Цитата sploid @
Обычно пользователи разбирают не картошка, хлеб, а продукты, оплата телефона, хоз. товары.

Не рекомендую судить по себе. Группами ведут потому что разбирать руками на товары долго и муторно Но сервис должен это уметь. И при этом работать быстро.

Автор: sploid 03.04.14, 12:47
Цитата Павел Калугин @
Цитата sploid @
Обычно пользователи разбирают не картошка, хлеб, а продукты, оплата телефона, хоз. товары.

Не рекомендую судить по себе. Группами ведут потому что разбирать руками на товары долго и муторно Но сервис должен это уметь. И при этом работать быстро.

Думаю, что когда мы дойдет до этого этапа, то уже будем решать по ходу дела.

В рамках этого топика я бы хотел привлечь людей, которые бы хотели подключиться а этому проекту.

Автор: Павел Калугин 03.04.14, 13:00
Цитата sploid @
Думаю, что когда мы дойдет до этого этапа, то уже будем решать по ходу дела.

Ответ на вопрос "зачем" вы считаете несущественным? Браво.!

Автор: sploid 03.04.14, 13:05
Цитата Павел Калугин @
Цитата sploid @
Думаю, что когда мы дойдет до этого этапа, то уже будем решать по ходу дела.

Ответ на вопрос "зачем" вы считаете несущественным? Браво.!

Я считаю не существенным делить шкуру не убитого медведя.
Я знаю несколько русскоязычных проекта, которые пытались реализовать парсинг чеков и у них этого не получилось.
Исходя из этого я делаю вывод, что не стоит сразу определятся какие фичи будут, а стоит в начале сделать прототип, а уже смотреть по ходу дела что можно из этого получить.

На вопрос "зачем" я уже отвечал выше.
На вопрос "какие фичи будут", считаю что лучше отвечать, когда будет прототип.

Автор: from business 10.06.14, 17:48
Цитата sploid @

Удалось решить задачку?

Автор: sploid 11.06.14, 17:46
К сожалению, нет желающий поучаствовать в проекте.

Я сделал некоторые наброски и пришел к выводу что задача частично решаема, но у самого нет времени на этот проект.
Когда я только начинал программировать, то был бы очень рад поучаствовать в подобном проекте, но почему-то, сейчас никого не нашел кто бы хотел поучаствовать в большом и интересном проекте ради опыта.

Может времена изменились.

Автор: MIF 11.06.14, 20:01
Может, времена другие, а , может, ты просто забыл указать интерес участников проекта.

Автор: MIF 11.06.14, 20:03
Перечитал первый пост. Есть, есть интерес!
Цитата sploid @
могу подтянуть плюсы у новичков

Автор: from business 12.06.14, 22:32
Если сможете создать эффективно работающий способ, то дайте знать. Есть заинтересованность в использовании подобного алгоритма в коммерческих проектов. При этом интересна как та задачка, которую поставил перед сообществом Sploid (распознавание чека, включая каждую позицию), так и чуть более простая задачка - распознавание "шапки" и "подвала" чека. Чеков значительное, но конечное количество типов (например, чеки 1000 видов). Алгоритм должен распознавать "шапку" чека (название магазина, ИНН, дату и прочие элементы шапки; все элементы расположены в строго заданном месте для каждого из 1000 видов чеков) и "подвал" чека - финальную сумму чека после скидок (вид подвала также строго задан для каждого из 1000 чеков, но может находиться в любом месте чека в зависимости от количества купленных позиций (т.е.чек может быть и метровой длины, но внешний вид подвала всегда идентичен). Вторая задачка точно будет востребована.

Автор: omorozov 07.08.14, 12:24
Мне интересна эта тема, с удовольствием поучаствовал бы, правда в С++ совсем новичок, так же изучаю python, веб-программирование.
Есть опыт в разработке локальных приложений баз данных по учету (Foxpro), в сопровождении и администрировании приложений и БД Oracle.

Автор: man0xff 13.10.14, 14:52
Было бы интересно поучаствовать. Большой опыт в C, немного C++, python.
Еще можно использовать распознавание чеков для социального проекта - сравнение цен в супермаркетах. Есть пара проектов, которые сравнивают стоимость товаров в розничных сетях, но проблема в том, что ввод информации с чека очень трудозатратный. Было бы круто, например, сделать прогу для смартфонов, чтобы можно было просто сфоткать чек и данные по ценам сразу отправляются на сервер для статистики.

На портале пользователь вводит несколько групп товаров, ему подбирается супермаркет из тех, что поблизости, с минимальной стоимостью. В профиле группы товаров кэшируются (я например часто хожу в магазин за одними и теми же товарами).

Еще можно реализовать распознавание ценников. Тогда можно собирать информацию по ценам просто пройдясь по магазину и сняв на видео большинство ценников и витрин.

Автор: sploid 13.10.14, 15:23
К сожалению, данный проект не ожил, т.к. непонятно как монетизировать данный проект.

Автор: CodeStudent 19.10.14, 22:33
Тема очень интересна, могу подключиться к проекту. Есть опыт разработки полезных программ на Qt с использованием OpenCV. Есть ли возможность связаться с вами помимо форума?
Мой e-mail: knight_vova@mail.ru

Автор: Павел Калугин 20.10.14, 09:19
sploid распознавание текста сами писать собирались?

Автор: sploid 20.10.14, 09:25
В начале попробовал сам разделить на символы и из разобрать, но сходу не получилось и я попробовал tesseract.
В tesseract есть обучение и я планировал его обучить шрифтам с чеков, ведь не так много контор выпускает кассовые аппараты.
Несомненно, пришлось бы делать доп. обработку результатов работы tesseract.

Автор: macik 28.10.14, 18:58
Жаль, что проект в замороженном состоянии. На счет монетизации, мне кажется, сработал бы вариант в виде отдельного веб-сервиса — для простых пользователей веб-интерфнейс, для остальных доступный API. А придумать тарифную сетку для этого не проблема. Мне кажется спрос бы был.

Не бросайте идею и держите в курсе.

Помочь именно с программированием в ряд ли смогу — уровень знания C у меня -5°С (т.е. на уровне PHP :)).

Но если есть более общие проблемы или не решенные вопросы может чем помогу (пишите на macik.spb на gmail .com).

p.s. Вот наткнулся на реализаторов аналогичной идеи http://hitfounder.livejournal.com/26404.html
у них что-то «не выстрелило».

Автор: Romtek 15.11.14, 10:49
Скорее, для данного проекта проблемой является то, что пользователи довольно ленивы и еженедельно сканировать бумажки слишком рутинно.

Вот если бы была возможность агрегировать поступающую с разных магазинов информацию о покупках, по интернету, то задача учёта сильно облегчилась бы.

Автор: Colt 17.11.14, 20:43
Цитата Romtek @
возможность агрегировать поступающую с разных магазинов информацию о покупка

В одном банке в ЛК есть такая фича ... при оплате с карты собирается инфа. (ЗЫ: по крайней мере про один банк мне известно)

Автор: dimax2000 04.02.15, 10:27
Добрый день sploid! Как дела с проектом? Меня он заинтересовал. Хотел бы пообщаться. dimax2000@gmail.com

Автор: sploid 04.02.15, 11:00
dimax2000
Цитата
К сожалению, данный проект не ожил, т.к. непонятно как монетизировать данный проект.

Автор: dimax2000 12.02.15, 13:34
Добрый день sploid!
Однозначной системы монетизации пока нет. Несть некое видение сервиса который будет использовать систему распознания чеков. И есть понимание, что если серви будет пользоваться популярностью у пользователей, то это может уже ценный автив. Подробней о сервисе готов рассказать на почту. Если есть интерес пиши.

Автор: Dibrov777 20.05.15, 14:12
как приложение в андроид полезная весчь.

Автор: Jin X 08.02.16, 22:37
sploid, форумы – вряд ли хорошее место для поиска партнёров. Это первое. Второе – это умение зажечь людей своей идеей. Ты этого пока не сделал.
Что касается монетизации и функционала, то вариантов может быть куча. В любом случае, всё эти варианты – лишь гипотезы, которые ещё нужно проверить. Если ты придумаешь сейчас один или два варианта (функционала/монетизации) и будешь под них всё делать, то они могут не сработать, и придётся всё переделывать. Тебе нужно очень много общаться на эту тему с людьми, делать много тестов, выпускать много промежуточных версий и тестировать их.
Почитай про Lean Startup и Customer Development, например, книгу: Стив Бланк, Боб Дорф. СтартUp. Настольная книга основателя (2013). Много интересного там есть.
p.s. Примеры монетизации (навскидку):
- продажа лицензии на использование в программах вроде той же "ДребеДеньги"
- продажа приложения в App Store
- продажа дополнительного функционала
- продажа всего проекта (поглощение/слияние)
- что-то другое, зависит от области применения

Автор: sploid 09.02.16, 07:23
Jin X, много у Вас запущенных проектов, что Вы так смело раздаете советы?

Автор: Jin X 09.02.16, 07:40
sploid, интересно, чем мои слова так задели?
Цитата Jin X @
Второе – это умение зажечь людей своей идеей
Вот этим?
Так, это размышления на тему:
Цитата sploid @
К сожалению, нет желающий поучаствовать в проекте.

А всё остальное – это неудачная (судя по всему) попытка приободрить на тему:
Цитата sploid @
К сожалению, данный проект не ожил, т.к. непонятно как монетизировать данный проект.
Странно, что она так воспринята.
Но тут уж всё индивидуально. Для кого-то это добрая мысль, а для кого-то нет... Ну ладно, no problem :)

Автор: sploid 09.02.16, 07:46
Jin X, Вы не ответили на вопрос про запущенные проекты.
Мне бы хотелось знать насколько опытный в бизнесе человек раздает советы по ведению бизнеса.

Автор: Jin X 09.02.16, 16:07
sploid, серьёзных запущенных IT-проектов у меня нет. Знания чисто теоретические (только читаю и слушаю аудиозаписи на эту тему). Мой бизнес в другой сфере деятельности.
Вы считаете, что посоветовать книгу и сделать замечание относительно отсутствия презентации – это "смелый совет по ведению бизнеса", который может причинить вред?
Или Вас оскорбило моё высказывание о том, что "форумы – вряд ли хорошее место для поиска партнёров"? В чём проблема?

Автор: sploid 09.02.16, 17:58
Я попробую составить список того что мне не понравилось в Вашем посте:
Цитата
вряд ли хорошее место для поиска партнёров

Я тут искал программистов.
Если бы искал партнеров, пошел бы на какой-нибудь biznet.ru

Цитата
Второе – это умение зажечь людей своей идеей. Ты этого пока не сделал.

Я этого и не пытался сделать. По моему опыту, те кто ведется на зажигательную презентацию очень быстро сливаются.

Цитата
Что касается монетизации и функционала, то вариантов может быть куча. В любом случае, всё эти варианты – лишь гипотезы, которые ещё нужно проверить. Если ты придумаешь сейчас один или два варианта (функционала/монетизации) и будешь под них всё делать, то они могут не сработать, и придётся всё переделывать. Тебе нужно очень много общаться на эту тему с людьми, делать много тестов, выпускать много промежуточных версий и тестировать их.

Как говорится "говорить не мешки ворочать". Что бы запустить какой-нибудь минимальный продукт, это несколько месяцев упорной работы. Если я не вижу даже примерной схемы заработка денег, то смысла делать я не вижу (если конечно не делать только что бы что-то делать). Большинство стартапов прогорает потому что они не написали бизнес план с прописанным планом монетизации и совсем не хочется быть в их числе.
Вот мне очень нравится подход Аркадия Морейниса "Хватит играть в стартапы". http://darkside.vc/

Цитата
Почитай про Lean Startup и Customer Development, например, книгу: Стив Бланк, Боб Дорф. СтартUp. Настольная книга основателя (2013). Много интересного там есть.

Непонятно с чего Вы ошибочно решили что я не читал про Lean Startup.

Цитата
p.s. Примеры монетизации (навскидку):
- продажа лицензии на использование в программах вроде той же "ДребеДеньги"
- продажа приложения в App Store
- продажа дополнительного функционала
- продажа всего проекта (поглощение/слияние)
- что-то другое, зависит от области применения

Мы с человеком проработали несколько вариантов монетизации и ни один из них не вывел бы проект на самоокупаемость с учетом технической сложности задачи.

Автор: Jin X 09.02.16, 20:07
Цитата sploid @
Как говорится "говорить не мешки ворочать". Что бы запустить какой-нибудь минимальный продукт, это несколько месяцев упорной работы.
Так, и я говорю, что всё не так просто, разве нет? :)

Цитата sploid @
Большинство стартапов прогорает потому что они не написали бизнес план с прописанным планом монетизации и совсем не хочется быть в их числе.
Не буду развивать дискуссию не эту тему, ибо не эксперт в оценке "почему прогорели те, а выстрелили эти", и Вам не советую. Вместе с тем, очень многие успешные ныне стартапы были запущены без чёткого плана монетизации. Даже тот же Viber или Яндекс, к примеру ("Директ" они явно не с самого начала придумали). А многие прогорели, имея хорошие планы. Полагаю, не в этом дело первостепенно. Хотя, несомненно, иметь такой план лучше. Если только он реален и проверен.

Цитата sploid @
Непонятно с чего Вы ошибочно решили что я не читал про Lean Startup.
Опять же, откуда такие выводы? Если я посоветовал книгу, это не значит, что я говорю, что Вы ничего не понимаете, а вот смотрите какой я умный.
Или Вы подумали, что я пытаюсь Вас жизни учить?

Цитата sploid @
Я тут искал программистов.
Если бы искал партнеров, пошел бы на какой-нибудь biznet.ru
Вам-то это понятно, но как говорится, в голову другому не залезешь. Ваше предложение участия в проекте было весьма размытым:
Цитата sploid @
Если кому-то интересно поучаствовать в проекте, пишите.
Цитата sploid @
В рамках этого топика я бы хотел привлечь людей, которые бы хотели подключиться а этому проекту.
И вот вполне адекватная реакция на это (даже не моя):
Цитата MIF @
может, ты просто забыл указать интерес участников проекта.
Где написано, что нужен именно программист, где написаны условия участия?
Здесь многие сидят и друг другу помогают просто так. Даже написание ОС люди обсуждали, но это скорее для прикола :lol: . Каких-то серьёзных коммерческих проектов я за больше чем 10 лет не припомню. DigiMania? :-?

Автор: sploid 09.02.16, 20:16
Jin X, какой у Вас опыт ведения бизнеса и запуска проектов?

Автор: Jin X 09.02.16, 20:29
Цитата sploid @
Jin X, какой у Вас опыт ведения бизнеса и запуска проектов?
Я ж уже писал об этом: запуском IT-стартапов не занимался.
Занимаюсь организацией праздников, 5 лет примерно.
А у Вас?

Автор: sploid 09.02.16, 20:32
Jin X в роли кого вы занимаетесь организацией праздников?
Дадите ссылку на портфолио?

К сожалению, у меня до текущего момента все проекты неудачные.

Автор: Jin X 09.02.16, 20:42
sploid, в роли руководителя праздничного агентства :)
В основном, детские праздники.
http://mandarish.ru
Раньше сам работал, сейчас только в редких случаях и обычно как администратор/координатор.
Может, в личку? ВК, например: http://xk7.ru/w
Чтоб других не грузить личной перепиской.
Интересно тоже, какие неудачные проекты были?

Автор: amk 10.02.16, 12:25
Цитата sploid @
Я тут искал программистов.
ты вроде уже давно здесь на форуме, и до сих пор не понял, что здесь не одни программисты тусуются? Тем более это явно не сайт руководителей IT-проектов.
А из программистов, большинство заходят совсем не для того, чтобы найти себе занятие на длительное время. В основном ответы здесь из тех, что можно дать мгновенно, хотя вопрос в голове откладывается, и ответ может кому-то прийти в голову через месяц после того, как вопрос задан.
Я к тому, что посоветовать тебе здесь что-нибудь могут, а вот найти программистов будет сложновато.

Автор: sploid 10.02.16, 19:36
Брысь, брысь из темы советчики, технари вернитесь.

Автор: amk 10.02.16, 20:16
То есть мне можно остаться? Поскольку я как раз технарь. Правда к проекту этому подключаться не буду.

Автор: sploid 10.02.16, 20:24
Да оставайтесь конечно, мне не жалко.
Темку только админов сейчас попрошу перенести в подобающий раздел, там где не по делу пишут.

Автор: AlBLR 26.02.16, 14:17
sploid, добрый день.
Свою идею полностью похоронили, или не совсем?

Получилось добиться от Tesseract приемлемых результатов разпознавания на 2-х языках сразу (русский и английский), имею в виду что текст русский, но могут быть английские слова?

Я тоже начал изучать технологию распознавания, хотел бы поучаствовать в вашем проекте.

Автор: sploid 26.02.16, 18:45
AlBLR, добрый.

На текущий момент полностью похоронили из-за того что непонятно как монетизировать.
Мы рассмотрели несколько вариантов и совсем непонятно кто и за что будет платить.
Еще очень большая проблема это то что одинаковые товары называют по разному в разных магазинах, поэтому сопоставить товары тоже не получится.

Powered by Invision Power Board (https://www.invisionboard.com)
© Invision Power Services (https://www.invisionpower.com)