Наши проекты:
Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту |
||
ПРАВИЛА | FAQ | Помощь | Поиск | Участники | Календарь | Избранное | RSS |
[18.221.174.248] |
|
Сообщ.
#1
,
|
|
|
Привет всем.
Я хочу реализовать проект по распознаванию магазинных чеков, но большие проблемы со временем. У меня есть некоторый опыт в обработке изображений и мне кажется, что проект с чеками можно реализовать. Мой опыт на С++ более 10 лет, могу подтянуть плюсы у новичков. Пока непонятен алгоритм монетизации проекта и вообще непонятно выгорит ли он. Если кому-то интересно поучаствовать в проекте, пишите. В работе будут использоваться: С++, OpenCV, Qt, tesseract |
Сообщ.
#2
,
|
|
|
А зачем распознавать магазинные чеки?
|
Сообщ.
#3
,
|
|
|
Ты понесешь чек к ноуту чтобы распознать его? Или все-таки скормишь Google Googgles на смартфоне?
Ну и +1 к вопросу Kosha. |
Сообщ.
#4
,
|
|
|
Цитата А зачем распознавать магазинные чеки? Распознавание чеков достаточно востребованная фича при ведении личной бухгалтерии. Можно интегрировать в такие проекты: http://www.gnucash.org/ drebedengi.ru - разговаривал с этими ребятами, сказали что востребованная фича и у них есть АПИ для интеграции, поэтому, для начала, можно к ним вкорячить. Добавлено Цитата Ты понесешь чек к ноуту чтобы распознать его? Или все-таки скормишь Google Googgles на смартфоне? Человек фоткает чек с телефона и он распознается. Далее этот чек можно будет добавить в какую-нибудь приложеньку учета финансов. Пока будет версия для ПК, но под Андройд полюбому надо будет потом пилить. Я хочу сделать сервис для распознавания чеков, а не приложение для учета личных финансов. Добавлено Этапы разработки: 1. Поворот чека - сделал 2. Разделение на строки - в процессе 3. Распознавание текста (tesseract) 4. Допил tesseract что бы можно было легко обучать новым символам и оставить только нужные символы 5. Обработка текста (поиск товаров, что за чек и т.п.) 6. Написать программу что бы пользователь сам мог обучить распоновалку своему чеку |
Сообщ.
#5
,
|
|
|
Цитата sploid @ Распознавание чеков достаточно востребованная фича при ведении личной бухгалтерии. При обязательном условии точного определения товара. Иначе - это будет мусор мало пригодный к использованию |
Сообщ.
#6
,
|
|
|
Цитата Павел Калугин @ Цитата sploid @ Распознавание чеков достаточно востребованная фича при ведении личной бухгалтерии. При обязательном условии точного определения товара. Иначе - это будет мусор мало пригодный к использованию Скорее надо определить не сам товар, а Категорию, к которой относится данный товар. Обычно пользователи разбирают не картошка, хлеб, а продукты, оплата телефона, хоз. товары. |
Сообщ.
#7
,
|
|
|
Цитата sploid @ Обычно пользователи разбирают не картошка, хлеб, а продукты, оплата телефона, хоз. товары. Не рекомендую судить по себе. Группами ведут потому что разбирать руками на товары долго и муторно Но сервис должен это уметь. И при этом работать быстро. |
Сообщ.
#8
,
|
|
|
Цитата Павел Калугин @ Цитата sploid @ Обычно пользователи разбирают не картошка, хлеб, а продукты, оплата телефона, хоз. товары. Не рекомендую судить по себе. Группами ведут потому что разбирать руками на товары долго и муторно Но сервис должен это уметь. И при этом работать быстро. Думаю, что когда мы дойдет до этого этапа, то уже будем решать по ходу дела. В рамках этого топика я бы хотел привлечь людей, которые бы хотели подключиться а этому проекту. |
Сообщ.
#9
,
|
|
|
Цитата sploid @ Думаю, что когда мы дойдет до этого этапа, то уже будем решать по ходу дела. Ответ на вопрос "зачем" вы считаете несущественным? Браво.! |
Сообщ.
#10
,
|
|
|
Цитата Павел Калугин @ Цитата sploid @ Думаю, что когда мы дойдет до этого этапа, то уже будем решать по ходу дела. Ответ на вопрос "зачем" вы считаете несущественным? Браво.! Я считаю не существенным делить шкуру не убитого медведя. Я знаю несколько русскоязычных проекта, которые пытались реализовать парсинг чеков и у них этого не получилось. Исходя из этого я делаю вывод, что не стоит сразу определятся какие фичи будут, а стоит в начале сделать прототип, а уже смотреть по ходу дела что можно из этого получить. На вопрос "зачем" я уже отвечал выше. На вопрос "какие фичи будут", считаю что лучше отвечать, когда будет прототип. |
Сообщ.
#11
,
|
|
|
Цитата sploid @ Удалось решить задачку? |
Сообщ.
#12
,
|
|
|
К сожалению, нет желающий поучаствовать в проекте.
Я сделал некоторые наброски и пришел к выводу что задача частично решаема, но у самого нет времени на этот проект. Когда я только начинал программировать, то был бы очень рад поучаствовать в подобном проекте, но почему-то, сейчас никого не нашел кто бы хотел поучаствовать в большом и интересном проекте ради опыта. Может времена изменились. |
Сообщ.
#13
,
|
|
|
Может, времена другие, а , может, ты просто забыл указать интерес участников проекта.
|
Сообщ.
#14
,
|
|
|
Перечитал первый пост. Есть, есть интерес!
Цитата sploid @ могу подтянуть плюсы у новичков |
Сообщ.
#15
,
|
|
|
Если сможете создать эффективно работающий способ, то дайте знать. Есть заинтересованность в использовании подобного алгоритма в коммерческих проектов. При этом интересна как та задачка, которую поставил перед сообществом Sploid (распознавание чека, включая каждую позицию), так и чуть более простая задачка - распознавание "шапки" и "подвала" чека. Чеков значительное, но конечное количество типов (например, чеки 1000 видов). Алгоритм должен распознавать "шапку" чека (название магазина, ИНН, дату и прочие элементы шапки; все элементы расположены в строго заданном месте для каждого из 1000 видов чеков) и "подвал" чека - финальную сумму чека после скидок (вид подвала также строго задан для каждого из 1000 чеков, но может находиться в любом месте чека в зависимости от количества купленных позиций (т.е.чек может быть и метровой длины, но внешний вид подвала всегда идентичен). Вторая задачка точно будет востребована.
|
Сообщ.
#16
,
|
|
|
Мне интересна эта тема, с удовольствием поучаствовал бы, правда в С++ совсем новичок, так же изучаю python, веб-программирование.
Есть опыт в разработке локальных приложений баз данных по учету (Foxpro), в сопровождении и администрировании приложений и БД Oracle. |
Сообщ.
#17
,
|
|
|
Было бы интересно поучаствовать. Большой опыт в C, немного C++, python.
Еще можно использовать распознавание чеков для социального проекта - сравнение цен в супермаркетах. Есть пара проектов, которые сравнивают стоимость товаров в розничных сетях, но проблема в том, что ввод информации с чека очень трудозатратный. Было бы круто, например, сделать прогу для смартфонов, чтобы можно было просто сфоткать чек и данные по ценам сразу отправляются на сервер для статистики. На портале пользователь вводит несколько групп товаров, ему подбирается супермаркет из тех, что поблизости, с минимальной стоимостью. В профиле группы товаров кэшируются (я например часто хожу в магазин за одними и теми же товарами). Еще можно реализовать распознавание ценников. Тогда можно собирать информацию по ценам просто пройдясь по магазину и сняв на видео большинство ценников и витрин. |
Сообщ.
#18
,
|
|
|
К сожалению, данный проект не ожил, т.к. непонятно как монетизировать данный проект.
|
Сообщ.
#19
,
|
|
|
Тема очень интересна, могу подключиться к проекту. Есть опыт разработки полезных программ на Qt с использованием OpenCV. Есть ли возможность связаться с вами помимо форума?
Мой e-mail: knight_vova@mail.ru |
Сообщ.
#20
,
|
|
|
sploid распознавание текста сами писать собирались?
|
Сообщ.
#21
,
|
|
|
В начале попробовал сам разделить на символы и из разобрать, но сходу не получилось и я попробовал tesseract.
В tesseract есть обучение и я планировал его обучить шрифтам с чеков, ведь не так много контор выпускает кассовые аппараты. Несомненно, пришлось бы делать доп. обработку результатов работы tesseract. |
Сообщ.
#22
,
|
|
|
Жаль, что проект в замороженном состоянии. На счет монетизации, мне кажется, сработал бы вариант в виде отдельного веб-сервиса — для простых пользователей веб-интерфнейс, для остальных доступный API. А придумать тарифную сетку для этого не проблема. Мне кажется спрос бы был.
Не бросайте идею и держите в курсе. Помочь именно с программированием в ряд ли смогу — уровень знания C у меня -5°С (т.е. на уровне PHP ). Но если есть более общие проблемы или не решенные вопросы может чем помогу (пишите на macik.spb на gmail .com). p.s. Вот наткнулся на реализаторов аналогичной идеи http://hitfounder.livejournal.com/26404.html у них что-то «не выстрелило». |
Сообщ.
#23
,
|
|
|
Скорее, для данного проекта проблемой является то, что пользователи довольно ленивы и еженедельно сканировать бумажки слишком рутинно.
Вот если бы была возможность агрегировать поступающую с разных магазинов информацию о покупках, по интернету, то задача учёта сильно облегчилась бы. |
Сообщ.
#24
,
|
|
|
Цитата Romtek @ возможность агрегировать поступающую с разных магазинов информацию о покупка В одном банке в ЛК есть такая фича ... при оплате с карты собирается инфа. (ЗЫ: по крайней мере про один банк мне известно) |
Сообщ.
#25
,
|
|
|
Добрый день sploid! Как дела с проектом? Меня он заинтересовал. Хотел бы пообщаться. dimax2000@gmail.com
|
Сообщ.
#26
,
|
|
|
dimax2000
Цитата К сожалению, данный проект не ожил, т.к. непонятно как монетизировать данный проект. |
Сообщ.
#27
,
|
|
|
Добрый день sploid!
Однозначной системы монетизации пока нет. Несть некое видение сервиса который будет использовать систему распознания чеков. И есть понимание, что если серви будет пользоваться популярностью у пользователей, то это может уже ценный автив. Подробней о сервисе готов рассказать на почту. Если есть интерес пиши. |
Сообщ.
#28
,
|
|
|
как приложение в андроид полезная весчь.
|
Сообщ.
#29
,
|
|
|
sploid, форумы – вряд ли хорошее место для поиска партнёров. Это первое. Второе – это умение зажечь людей своей идеей. Ты этого пока не сделал.
Что касается монетизации и функционала, то вариантов может быть куча. В любом случае, всё эти варианты – лишь гипотезы, которые ещё нужно проверить. Если ты придумаешь сейчас один или два варианта (функционала/монетизации) и будешь под них всё делать, то они могут не сработать, и придётся всё переделывать. Тебе нужно очень много общаться на эту тему с людьми, делать много тестов, выпускать много промежуточных версий и тестировать их. Почитай про Lean Startup и Customer Development, например, книгу: Стив Бланк, Боб Дорф. СтартUp. Настольная книга основателя (2013). Много интересного там есть. p.s. Примеры монетизации (навскидку): - продажа лицензии на использование в программах вроде той же "ДребеДеньги" - продажа приложения в App Store - продажа дополнительного функционала - продажа всего проекта (поглощение/слияние) - что-то другое, зависит от области применения |
Сообщ.
#30
,
|
|
|
Jin X, много у Вас запущенных проектов, что Вы так смело раздаете советы?
|
Сообщ.
#31
,
|
|
|
sploid, интересно, чем мои слова так задели?
Цитата Jin X @ Вот этим?Второе – это умение зажечь людей своей идеей Так, это размышления на тему: Цитата sploid @ К сожалению, нет желающий поучаствовать в проекте. А всё остальное – это неудачная (судя по всему) попытка приободрить на тему: Цитата sploid @ Странно, что она так воспринята.К сожалению, данный проект не ожил, т.к. непонятно как монетизировать данный проект. Но тут уж всё индивидуально. Для кого-то это добрая мысль, а для кого-то нет... Ну ладно, no problem |
Сообщ.
#32
,
|
|
|
Jin X, Вы не ответили на вопрос про запущенные проекты.
Мне бы хотелось знать насколько опытный в бизнесе человек раздает советы по ведению бизнеса. |
Сообщ.
#33
,
|
|
|
sploid, серьёзных запущенных IT-проектов у меня нет. Знания чисто теоретические (только читаю и слушаю аудиозаписи на эту тему). Мой бизнес в другой сфере деятельности.
Вы считаете, что посоветовать книгу и сделать замечание относительно отсутствия презентации – это "смелый совет по ведению бизнеса", который может причинить вред? Или Вас оскорбило моё высказывание о том, что "форумы – вряд ли хорошее место для поиска партнёров"? В чём проблема? |
Сообщ.
#34
,
|
|
|
Я попробую составить список того что мне не понравилось в Вашем посте:
Цитата вряд ли хорошее место для поиска партнёров Я тут искал программистов. Если бы искал партнеров, пошел бы на какой-нибудь biznet.ru Цитата Второе – это умение зажечь людей своей идеей. Ты этого пока не сделал. Я этого и не пытался сделать. По моему опыту, те кто ведется на зажигательную презентацию очень быстро сливаются. Цитата Что касается монетизации и функционала, то вариантов может быть куча. В любом случае, всё эти варианты – лишь гипотезы, которые ещё нужно проверить. Если ты придумаешь сейчас один или два варианта (функционала/монетизации) и будешь под них всё делать, то они могут не сработать, и придётся всё переделывать. Тебе нужно очень много общаться на эту тему с людьми, делать много тестов, выпускать много промежуточных версий и тестировать их. Как говорится "говорить не мешки ворочать". Что бы запустить какой-нибудь минимальный продукт, это несколько месяцев упорной работы. Если я не вижу даже примерной схемы заработка денег, то смысла делать я не вижу (если конечно не делать только что бы что-то делать). Большинство стартапов прогорает потому что они не написали бизнес план с прописанным планом монетизации и совсем не хочется быть в их числе. Вот мне очень нравится подход Аркадия Морейниса "Хватит играть в стартапы". http://darkside.vc/ Цитата Почитай про Lean Startup и Customer Development, например, книгу: Стив Бланк, Боб Дорф. СтартUp. Настольная книга основателя (2013). Много интересного там есть. Непонятно с чего Вы ошибочно решили что я не читал про Lean Startup. Цитата p.s. Примеры монетизации (навскидку): - продажа лицензии на использование в программах вроде той же "ДребеДеньги" - продажа приложения в App Store - продажа дополнительного функционала - продажа всего проекта (поглощение/слияние) - что-то другое, зависит от области применения Мы с человеком проработали несколько вариантов монетизации и ни один из них не вывел бы проект на самоокупаемость с учетом технической сложности задачи. |
Сообщ.
#35
,
|
|
|
Цитата sploid @ Так, и я говорю, что всё не так просто, разве нет? Как говорится "говорить не мешки ворочать". Что бы запустить какой-нибудь минимальный продукт, это несколько месяцев упорной работы. Цитата sploid @ Не буду развивать дискуссию не эту тему, ибо не эксперт в оценке "почему прогорели те, а выстрелили эти", и Вам не советую. Вместе с тем, очень многие успешные ныне стартапы были запущены без чёткого плана монетизации. Даже тот же Viber или Яндекс, к примеру ("Директ" они явно не с самого начала придумали). А многие прогорели, имея хорошие планы. Полагаю, не в этом дело первостепенно. Хотя, несомненно, иметь такой план лучше. Если только он реален и проверен.Большинство стартапов прогорает потому что они не написали бизнес план с прописанным планом монетизации и совсем не хочется быть в их числе. Цитата sploid @ Опять же, откуда такие выводы? Если я посоветовал книгу, это не значит, что я говорю, что Вы ничего не понимаете, а вот смотрите какой я умный.Непонятно с чего Вы ошибочно решили что я не читал про Lean Startup. Или Вы подумали, что я пытаюсь Вас жизни учить? Цитата sploid @ Вам-то это понятно, но как говорится, в голову другому не залезешь. Ваше предложение участия в проекте было весьма размытым:Я тут искал программистов. Если бы искал партнеров, пошел бы на какой-нибудь biznet.ru Цитата sploid @ Если кому-то интересно поучаствовать в проекте, пишите. Цитата sploid @ И вот вполне адекватная реакция на это (даже не моя):В рамках этого топика я бы хотел привлечь людей, которые бы хотели подключиться а этому проекту. Цитата MIF @ Где написано, что нужен именно программист, где написаны условия участия?может, ты просто забыл указать интерес участников проекта. Здесь многие сидят и друг другу помогают просто так. Даже написание ОС люди обсуждали, но это скорее для прикола . Каких-то серьёзных коммерческих проектов я за больше чем 10 лет не припомню. DigiMania? |
Сообщ.
#36
,
|
|
|
Jin X, какой у Вас опыт ведения бизнеса и запуска проектов?
|
Сообщ.
#37
,
|
|
|
Цитата sploid @ Я ж уже писал об этом: запуском IT-стартапов не занимался.Jin X, какой у Вас опыт ведения бизнеса и запуска проектов? Занимаюсь организацией праздников, 5 лет примерно. А у Вас? |
Сообщ.
#38
,
|
|
|
Jin X в роли кого вы занимаетесь организацией праздников?
Дадите ссылку на портфолио? К сожалению, у меня до текущего момента все проекты неудачные. |
Сообщ.
#39
,
|
|
|
sploid, в роли руководителя праздничного агентства
В основном, детские праздники. http://mandarish.ru Раньше сам работал, сейчас только в редких случаях и обычно как администратор/координатор. Может, в личку? ВК, например: http://xk7.ru/w Чтоб других не грузить личной перепиской. Интересно тоже, какие неудачные проекты были? |
Сообщ.
#40
,
|
|
|
Цитата sploid @ ты вроде уже давно здесь на форуме, и до сих пор не понял, что здесь не одни программисты тусуются? Тем более это явно не сайт руководителей IT-проектов.Я тут искал программистов. А из программистов, большинство заходят совсем не для того, чтобы найти себе занятие на длительное время. В основном ответы здесь из тех, что можно дать мгновенно, хотя вопрос в голове откладывается, и ответ может кому-то прийти в голову через месяц после того, как вопрос задан. Я к тому, что посоветовать тебе здесь что-нибудь могут, а вот найти программистов будет сложновато. |
Сообщ.
#41
,
|
|
|
Брысь, брысь из темы советчики, технари вернитесь.
|
Сообщ.
#42
,
|
|
|
То есть мне можно остаться? Поскольку я как раз технарь. Правда к проекту этому подключаться не буду.
|
Сообщ.
#43
,
|
|
|
Да оставайтесь конечно, мне не жалко.
Темку только админов сейчас попрошу перенести в подобающий раздел, там где не по делу пишут. |
Сообщ.
#44
,
|
|
|
sploid, добрый день.
Свою идею полностью похоронили, или не совсем? Получилось добиться от Tesseract приемлемых результатов разпознавания на 2-х языках сразу (русский и английский), имею в виду что текст русский, но могут быть английские слова? Я тоже начал изучать технологию распознавания, хотел бы поучаствовать в вашем проекте. |
Сообщ.
#45
,
|
|
|
AlBLR, добрый.
На текущий момент полностью похоронили из-за того что непонятно как монетизировать. Мы рассмотрели несколько вариантов и совсем непонятно кто и за что будет платить. Еще очень большая проблема это то что одинаковые товары называют по разному в разных магазинах, поэтому сопоставить товары тоже не получится. |