На главную Наши проекты:
Журнал   ·   Discuz!ML   ·   Wiki   ·   DRKB   ·   Помощь проекту
ПРАВИЛА FAQ Помощь Участники Календарь Избранное RSS
msm.ru
  
> Проект по распознаванию чеков , собираю команду
    Привет всем.

    Я хочу реализовать проект по распознаванию магазинных чеков, но большие проблемы со временем.
    У меня есть некоторый опыт в обработке изображений и мне кажется, что проект с чеками можно реализовать.
    Мой опыт на С++ более 10 лет, могу подтянуть плюсы у новичков.
    Пока непонятен алгоритм монетизации проекта и вообще непонятно выгорит ли он.
    Если кому-то интересно поучаствовать в проекте, пишите.

    В работе будут использоваться:
    С++, OpenCV, Qt, tesseract
      А зачем распознавать магазинные чеки?
        Ты понесешь чек к ноуту чтобы распознать его? Или все-таки скормишь Google Googgles на смартфоне?

        Ну и +1 к вопросу Kosha.
          Цитата
          А зачем распознавать магазинные чеки?


          Распознавание чеков достаточно востребованная фича при ведении личной бухгалтерии.
          Можно интегрировать в такие проекты:
          http://www.gnucash.org/
          drebedengi.ru - разговаривал с этими ребятами, сказали что востребованная фича и у них есть АПИ для интеграции, поэтому, для начала, можно к ним вкорячить.

          Добавлено
          Цитата
          Ты понесешь чек к ноуту чтобы распознать его? Или все-таки скормишь Google Googgles на смартфоне?


          Человек фоткает чек с телефона и он распознается.
          Далее этот чек можно будет добавить в какую-нибудь приложеньку учета финансов.
          Пока будет версия для ПК, но под Андройд полюбому надо будет потом пилить.

          Я хочу сделать сервис для распознавания чеков, а не приложение для учета личных финансов.

          Добавлено
          Этапы разработки:
          1. Поворот чека - сделал
          2. Разделение на строки - в процессе
          3. Распознавание текста (tesseract)
          4. Допил tesseract что бы можно было легко обучать новым символам и оставить только нужные символы
          5. Обработка текста (поиск товаров, что за чек и т.п.)
          6. Написать программу что бы пользователь сам мог обучить распоновалку своему чеку
            Цитата sploid @
            Распознавание чеков достаточно востребованная фича при ведении личной бухгалтерии.

            При обязательном условии точного определения товара. Иначе - это будет мусор мало пригодный к использованию
              Цитата Павел Калугин @
              Цитата sploid @
              Распознавание чеков достаточно востребованная фича при ведении личной бухгалтерии.

              При обязательном условии точного определения товара. Иначе - это будет мусор мало пригодный к использованию

              Скорее надо определить не сам товар, а Категорию, к которой относится данный товар.
              Обычно пользователи разбирают не картошка, хлеб, а продукты, оплата телефона, хоз. товары.
                Цитата sploid @
                Обычно пользователи разбирают не картошка, хлеб, а продукты, оплата телефона, хоз. товары.

                Не рекомендую судить по себе. Группами ведут потому что разбирать руками на товары долго и муторно Но сервис должен это уметь. И при этом работать быстро.
                  Цитата Павел Калугин @
                  Цитата sploid @
                  Обычно пользователи разбирают не картошка, хлеб, а продукты, оплата телефона, хоз. товары.

                  Не рекомендую судить по себе. Группами ведут потому что разбирать руками на товары долго и муторно Но сервис должен это уметь. И при этом работать быстро.

                  Думаю, что когда мы дойдет до этого этапа, то уже будем решать по ходу дела.

                  В рамках этого топика я бы хотел привлечь людей, которые бы хотели подключиться а этому проекту.
                    Цитата sploid @
                    Думаю, что когда мы дойдет до этого этапа, то уже будем решать по ходу дела.

                    Ответ на вопрос "зачем" вы считаете несущественным? Браво.!
                      Цитата Павел Калугин @
                      Цитата sploid @
                      Думаю, что когда мы дойдет до этого этапа, то уже будем решать по ходу дела.

                      Ответ на вопрос "зачем" вы считаете несущественным? Браво.!

                      Я считаю не существенным делить шкуру не убитого медведя.
                      Я знаю несколько русскоязычных проекта, которые пытались реализовать парсинг чеков и у них этого не получилось.
                      Исходя из этого я делаю вывод, что не стоит сразу определятся какие фичи будут, а стоит в начале сделать прототип, а уже смотреть по ходу дела что можно из этого получить.

                      На вопрос "зачем" я уже отвечал выше.
                      На вопрос "какие фичи будут", считаю что лучше отвечать, когда будет прототип.
                        Цитата sploid @

                        Удалось решить задачку?
                          К сожалению, нет желающий поучаствовать в проекте.

                          Я сделал некоторые наброски и пришел к выводу что задача частично решаема, но у самого нет времени на этот проект.
                          Когда я только начинал программировать, то был бы очень рад поучаствовать в подобном проекте, но почему-то, сейчас никого не нашел кто бы хотел поучаствовать в большом и интересном проекте ради опыта.

                          Может времена изменились.
                            Может, времена другие, а , может, ты просто забыл указать интерес участников проекта.
                              Перечитал первый пост. Есть, есть интерес!
                              Цитата sploid @
                              могу подтянуть плюсы у новичков
                                Если сможете создать эффективно работающий способ, то дайте знать. Есть заинтересованность в использовании подобного алгоритма в коммерческих проектов. При этом интересна как та задачка, которую поставил перед сообществом Sploid (распознавание чека, включая каждую позицию), так и чуть более простая задачка - распознавание "шапки" и "подвала" чека. Чеков значительное, но конечное количество типов (например, чеки 1000 видов). Алгоритм должен распознавать "шапку" чека (название магазина, ИНН, дату и прочие элементы шапки; все элементы расположены в строго заданном месте для каждого из 1000 видов чеков) и "подвал" чека - финальную сумму чека после скидок (вид подвала также строго задан для каждого из 1000 чеков, но может находиться в любом месте чека в зависимости от количества купленных позиций (т.е.чек может быть и метровой длины, но внешний вид подвала всегда идентичен). Вторая задачка точно будет востребована.
                                  Мне интересна эта тема, с удовольствием поучаствовал бы, правда в С++ совсем новичок, так же изучаю python, веб-программирование.
                                  Есть опыт в разработке локальных приложений баз данных по учету (Foxpro), в сопровождении и администрировании приложений и БД Oracle.
                                    Было бы интересно поучаствовать. Большой опыт в C, немного C++, python.
                                    Еще можно использовать распознавание чеков для социального проекта - сравнение цен в супермаркетах. Есть пара проектов, которые сравнивают стоимость товаров в розничных сетях, но проблема в том, что ввод информации с чека очень трудозатратный. Было бы круто, например, сделать прогу для смартфонов, чтобы можно было просто сфоткать чек и данные по ценам сразу отправляются на сервер для статистики.

                                    На портале пользователь вводит несколько групп товаров, ему подбирается супермаркет из тех, что поблизости, с минимальной стоимостью. В профиле группы товаров кэшируются (я например часто хожу в магазин за одними и теми же товарами).

                                    Еще можно реализовать распознавание ценников. Тогда можно собирать информацию по ценам просто пройдясь по магазину и сняв на видео большинство ценников и витрин.
                                    Сообщение отредактировано: man0xff -
                                      К сожалению, данный проект не ожил, т.к. непонятно как монетизировать данный проект.
                                        Тема очень интересна, могу подключиться к проекту. Есть опыт разработки полезных программ на Qt с использованием OpenCV. Есть ли возможность связаться с вами помимо форума?
                                        Мой e-mail: knight_vova@mail.ru
                                          sploid распознавание текста сами писать собирались?
                                            В начале попробовал сам разделить на символы и из разобрать, но сходу не получилось и я попробовал tesseract.
                                            В tesseract есть обучение и я планировал его обучить шрифтам с чеков, ведь не так много контор выпускает кассовые аппараты.
                                            Несомненно, пришлось бы делать доп. обработку результатов работы tesseract.
                                              Жаль, что проект в замороженном состоянии. На счет монетизации, мне кажется, сработал бы вариант в виде отдельного веб-сервиса — для простых пользователей веб-интерфнейс, для остальных доступный API. А придумать тарифную сетку для этого не проблема. Мне кажется спрос бы был.

                                              Не бросайте идею и держите в курсе.

                                              Помочь именно с программированием в ряд ли смогу — уровень знания C у меня -5°С (т.е. на уровне PHP :)).

                                              Но если есть более общие проблемы или не решенные вопросы может чем помогу (пишите на macik.spb на gmail .com).

                                              p.s. Вот наткнулся на реализаторов аналогичной идеи http://hitfounder.livejournal.com/26404.html
                                              у них что-то «не выстрелило».
                                              Сообщение отредактировано: macik -
                                                Скорее, для данного проекта проблемой является то, что пользователи довольно ленивы и еженедельно сканировать бумажки слишком рутинно.

                                                Вот если бы была возможность агрегировать поступающую с разных магазинов информацию о покупках, по интернету, то задача учёта сильно облегчилась бы.
                                                  Цитата Romtek @
                                                  возможность агрегировать поступающую с разных магазинов информацию о покупка

                                                  В одном банке в ЛК есть такая фича ... при оплате с карты собирается инфа. (ЗЫ: по крайней мере про один банк мне известно)
                                                  Сообщение отредактировано: Colt -
                                                    Добрый день sploid! Как дела с проектом? Меня он заинтересовал. Хотел бы пообщаться. dimax2000@gmail.com
                                                      dimax2000
                                                      Цитата
                                                      К сожалению, данный проект не ожил, т.к. непонятно как монетизировать данный проект.
                                                        Добрый день sploid!
                                                        Однозначной системы монетизации пока нет. Несть некое видение сервиса который будет использовать систему распознания чеков. И есть понимание, что если серви будет пользоваться популярностью у пользователей, то это может уже ценный автив. Подробней о сервисе готов рассказать на почту. Если есть интерес пиши.
                                                          как приложение в андроид полезная весчь.
                                                            sploid, форумы – вряд ли хорошее место для поиска партнёров. Это первое. Второе – это умение зажечь людей своей идеей. Ты этого пока не сделал.
                                                            Что касается монетизации и функционала, то вариантов может быть куча. В любом случае, всё эти варианты – лишь гипотезы, которые ещё нужно проверить. Если ты придумаешь сейчас один или два варианта (функционала/монетизации) и будешь под них всё делать, то они могут не сработать, и придётся всё переделывать. Тебе нужно очень много общаться на эту тему с людьми, делать много тестов, выпускать много промежуточных версий и тестировать их.
                                                            Почитай про Lean Startup и Customer Development, например, книгу: Стив Бланк, Боб Дорф. СтартUp. Настольная книга основателя (2013). Много интересного там есть.
                                                            p.s. Примеры монетизации (навскидку):
                                                            - продажа лицензии на использование в программах вроде той же "ДребеДеньги"
                                                            - продажа приложения в App Store
                                                            - продажа дополнительного функционала
                                                            - продажа всего проекта (поглощение/слияние)
                                                            - что-то другое, зависит от области применения
                                                              Jin X, много у Вас запущенных проектов, что Вы так смело раздаете советы?
                                                                sploid, интересно, чем мои слова так задели?
                                                                Цитата Jin X @
                                                                Второе – это умение зажечь людей своей идеей
                                                                Вот этим?
                                                                Так, это размышления на тему:
                                                                Цитата sploid @
                                                                К сожалению, нет желающий поучаствовать в проекте.

                                                                А всё остальное – это неудачная (судя по всему) попытка приободрить на тему:
                                                                Цитата sploid @
                                                                К сожалению, данный проект не ожил, т.к. непонятно как монетизировать данный проект.
                                                                Странно, что она так воспринята.
                                                                Но тут уж всё индивидуально. Для кого-то это добрая мысль, а для кого-то нет... Ну ладно, no problem :)
                                                                  Jin X, Вы не ответили на вопрос про запущенные проекты.
                                                                  Мне бы хотелось знать насколько опытный в бизнесе человек раздает советы по ведению бизнеса.
                                                                    sploid, серьёзных запущенных IT-проектов у меня нет. Знания чисто теоретические (только читаю и слушаю аудиозаписи на эту тему). Мой бизнес в другой сфере деятельности.
                                                                    Вы считаете, что посоветовать книгу и сделать замечание относительно отсутствия презентации – это "смелый совет по ведению бизнеса", который может причинить вред?
                                                                    Или Вас оскорбило моё высказывание о том, что "форумы – вряд ли хорошее место для поиска партнёров"? В чём проблема?
                                                                      Я попробую составить список того что мне не понравилось в Вашем посте:
                                                                      Цитата
                                                                      вряд ли хорошее место для поиска партнёров

                                                                      Я тут искал программистов.
                                                                      Если бы искал партнеров, пошел бы на какой-нибудь biznet.ru

                                                                      Цитата
                                                                      Второе – это умение зажечь людей своей идеей. Ты этого пока не сделал.

                                                                      Я этого и не пытался сделать. По моему опыту, те кто ведется на зажигательную презентацию очень быстро сливаются.

                                                                      Цитата
                                                                      Что касается монетизации и функционала, то вариантов может быть куча. В любом случае, всё эти варианты – лишь гипотезы, которые ещё нужно проверить. Если ты придумаешь сейчас один или два варианта (функционала/монетизации) и будешь под них всё делать, то они могут не сработать, и придётся всё переделывать. Тебе нужно очень много общаться на эту тему с людьми, делать много тестов, выпускать много промежуточных версий и тестировать их.

                                                                      Как говорится "говорить не мешки ворочать". Что бы запустить какой-нибудь минимальный продукт, это несколько месяцев упорной работы. Если я не вижу даже примерной схемы заработка денег, то смысла делать я не вижу (если конечно не делать только что бы что-то делать). Большинство стартапов прогорает потому что они не написали бизнес план с прописанным планом монетизации и совсем не хочется быть в их числе.
                                                                      Вот мне очень нравится подход Аркадия Морейниса "Хватит играть в стартапы". http://darkside.vc/

                                                                      Цитата
                                                                      Почитай про Lean Startup и Customer Development, например, книгу: Стив Бланк, Боб Дорф. СтартUp. Настольная книга основателя (2013). Много интересного там есть.

                                                                      Непонятно с чего Вы ошибочно решили что я не читал про Lean Startup.

                                                                      Цитата
                                                                      p.s. Примеры монетизации (навскидку):
                                                                      - продажа лицензии на использование в программах вроде той же "ДребеДеньги"
                                                                      - продажа приложения в App Store
                                                                      - продажа дополнительного функционала
                                                                      - продажа всего проекта (поглощение/слияние)
                                                                      - что-то другое, зависит от области применения

                                                                      Мы с человеком проработали несколько вариантов монетизации и ни один из них не вывел бы проект на самоокупаемость с учетом технической сложности задачи.
                                                                        Цитата sploid @
                                                                        Как говорится "говорить не мешки ворочать". Что бы запустить какой-нибудь минимальный продукт, это несколько месяцев упорной работы.
                                                                        Так, и я говорю, что всё не так просто, разве нет? :)

                                                                        Цитата sploid @
                                                                        Большинство стартапов прогорает потому что они не написали бизнес план с прописанным планом монетизации и совсем не хочется быть в их числе.
                                                                        Не буду развивать дискуссию не эту тему, ибо не эксперт в оценке "почему прогорели те, а выстрелили эти", и Вам не советую. Вместе с тем, очень многие успешные ныне стартапы были запущены без чёткого плана монетизации. Даже тот же Viber или Яндекс, к примеру ("Директ" они явно не с самого начала придумали). А многие прогорели, имея хорошие планы. Полагаю, не в этом дело первостепенно. Хотя, несомненно, иметь такой план лучше. Если только он реален и проверен.

                                                                        Цитата sploid @
                                                                        Непонятно с чего Вы ошибочно решили что я не читал про Lean Startup.
                                                                        Опять же, откуда такие выводы? Если я посоветовал книгу, это не значит, что я говорю, что Вы ничего не понимаете, а вот смотрите какой я умный.
                                                                        Или Вы подумали, что я пытаюсь Вас жизни учить?

                                                                        Цитата sploid @
                                                                        Я тут искал программистов.
                                                                        Если бы искал партнеров, пошел бы на какой-нибудь biznet.ru
                                                                        Вам-то это понятно, но как говорится, в голову другому не залезешь. Ваше предложение участия в проекте было весьма размытым:
                                                                        Цитата sploid @
                                                                        Если кому-то интересно поучаствовать в проекте, пишите.
                                                                        Цитата sploid @
                                                                        В рамках этого топика я бы хотел привлечь людей, которые бы хотели подключиться а этому проекту.
                                                                        И вот вполне адекватная реакция на это (даже не моя):
                                                                        Цитата MIF @
                                                                        может, ты просто забыл указать интерес участников проекта.
                                                                        Где написано, что нужен именно программист, где написаны условия участия?
                                                                        Здесь многие сидят и друг другу помогают просто так. Даже написание ОС люди обсуждали, но это скорее для прикола :lol: . Каких-то серьёзных коммерческих проектов я за больше чем 10 лет не припомню. DigiMania? :-?
                                                                          Jin X, какой у Вас опыт ведения бизнеса и запуска проектов?
                                                                            Цитата sploid @
                                                                            Jin X, какой у Вас опыт ведения бизнеса и запуска проектов?
                                                                            Я ж уже писал об этом: запуском IT-стартапов не занимался.
                                                                            Занимаюсь организацией праздников, 5 лет примерно.
                                                                            А у Вас?
                                                                              Jin X в роли кого вы занимаетесь организацией праздников?
                                                                              Дадите ссылку на портфолио?

                                                                              К сожалению, у меня до текущего момента все проекты неудачные.
                                                                              Сообщение отредактировано: sploid -
                                                                                sploid, в роли руководителя праздничного агентства :)
                                                                                В основном, детские праздники.
                                                                                http://mandarish.ru
                                                                                Раньше сам работал, сейчас только в редких случаях и обычно как администратор/координатор.
                                                                                Может, в личку? ВК, например: http://xk7.ru/w
                                                                                Чтоб других не грузить личной перепиской.
                                                                                Интересно тоже, какие неудачные проекты были?
                                                                                  Цитата sploid @
                                                                                  Я тут искал программистов.
                                                                                  ты вроде уже давно здесь на форуме, и до сих пор не понял, что здесь не одни программисты тусуются? Тем более это явно не сайт руководителей IT-проектов.
                                                                                  А из программистов, большинство заходят совсем не для того, чтобы найти себе занятие на длительное время. В основном ответы здесь из тех, что можно дать мгновенно, хотя вопрос в голове откладывается, и ответ может кому-то прийти в голову через месяц после того, как вопрос задан.
                                                                                  Я к тому, что посоветовать тебе здесь что-нибудь могут, а вот найти программистов будет сложновато.
                                                                                    Брысь, брысь из темы советчики, технари вернитесь.
                                                                                      То есть мне можно остаться? Поскольку я как раз технарь. Правда к проекту этому подключаться не буду.
                                                                                        Да оставайтесь конечно, мне не жалко.
                                                                                        Темку только админов сейчас попрошу перенести в подобающий раздел, там где не по делу пишут.
                                                                                          sploid, добрый день.
                                                                                          Свою идею полностью похоронили, или не совсем?

                                                                                          Получилось добиться от Tesseract приемлемых результатов разпознавания на 2-х языках сразу (русский и английский), имею в виду что текст русский, но могут быть английские слова?

                                                                                          Я тоже начал изучать технологию распознавания, хотел бы поучаствовать в вашем проекте.
                                                                                            AlBLR, добрый.

                                                                                            На текущий момент полностью похоронили из-за того что непонятно как монетизировать.
                                                                                            Мы рассмотрели несколько вариантов и совсем непонятно кто и за что будет платить.
                                                                                            Еще очень большая проблема это то что одинаковые товары называют по разному в разных магазинах, поэтому сопоставить товары тоже не получится.
                                                                                            0 пользователей читают эту тему (0 гостей и 0 скрытых пользователей)
                                                                                            0 пользователей:


                                                                                            Рейтинг@Mail.ru
                                                                                            [ Script execution time: 0,1032 ]   [ 16 queries used ]   [ Generated: 28.03.24, 08:50 GMT ]