а оплату маршрутки регистрировать в один клик :)
- orie
from fftogo
Re: OCR stuff is not as hard as it seems: there aren't too many receipt formats, and you usually shop in less than a dozen stores.
- אלף
from Android
@alf ocr был бы nice touch, но кмк сильно после того как будет базовый workflow
- Igor Sereda
кстати, по OCR может быть согласятся мои коллеги поконсультировать
- orie
from fftogo
OCR можно делать на телефонах, но нужно точно выверить список тех, у которых камера умеет макро - без него сканирование чеков будет глючить... на эти грабли уже наступали известные спецы в этой области (не мой р/датель)
- A. T.
Ещё проблем в копилку: чеки бывают длинными, особенно если это чек из паба человек на 10. Чеки бывают просто большими (несколько А4), как в Metro C&C. Впрочем, в последнем случае есть ещё и обычный узкий чек. Но можно пытаться клеить панорамы :)
- אלף
@silpol предполагается онлайн-сервис, так что собственно OCR-ить можно и на сервере. А вот разборчивость да...
- אלף
Плюс почти все телефоны (J2ME MIDP2.0 и Android, например) умеют получать SMS, и поднимать по ним софтинку. Так можно просыпаться по SMS от банка и импортить изменение статуса счёта, равно как и название merchant-а, в свою бухгалтерию. Каюсь, за год не написал ничего, кроме парсера, и тот посеял :)
- אלף
Re beta-testing - всех позовём в первой волне =) @alf парсеть SMSные уведомления из банки - это да, следующий etap. Правда, по наивности собирался думать про форвардинг. Если вместо этого можно проснуться, сабмитнуть формочку, заснуть обратно - это очень сильно упрощает жызнь
- Count Caturday
OCR чеков - можно, конечно, пробовать выжать САМЫЕ БОЛЬШЕ ЦИФРЫ в кадре в качестве суммы, но пост-процессинг всё одно нужен =(
- Count Caturday
@bleys на андроиде можно, на J2ME — как бы можно, но попап взлетит с вопросом, можно ли этому зверю тут в инет лезть.
- אלף
@alf а ответ "можно, и сейчас, и потом, и перестаньте уже спрашивать" у них не предусмотрен?
- Count Caturday
@bleys сильно зависит от телефона. Теоретически, подписанный мидлет должен спросить один раз, при установке. Практически у меня слишком мало опыта, надо спрашивать @seliv и @howldz.
- אלף
@howldz, кстати, говорит, что лучше использовать не e-mail, а http POST.
- Denis K
Дада, и меня можно записать? Я бы если получится — и для айфона что-нить поковырял в поддержку, так сказать. :)
- Йокарный
Пока что здесь записывают, отыщем дизайнера - сделаем формочку для подписки на анонсы
- Count Caturday
@denspb на время отсутствия J2ME приложения таки всё одно придётся понимать емылы =)
- Count Caturday
дело не в том ГДЕ OCR-ить, дело в том что может твоя оптика на таком коротком расстоянии... яблофонам приходится надевать <s>спинжак с карманАми</s> специальный macro-lens jacket... наши N- и E- series многие могут, но изрядная доля не сможет... там все не так просто. Я хотел сделать на своей цацке (макрорежим есть, OCR можно в DSP chip запихнуть), но вам Linux вряд ли interесен.
- A. T.
А прикладная девайсина — не вариант? В виде толстой кредитки, куда вставляем/прикладываем угол чека с числами и оно сканирует? Скидывать можно куда-нить по синезубу например… На продажах железяки можно подзаработать. Только не понимаю, удобнее получится или совсем ужас? Или не кредитка а такая блямба/брелок для ключей с камерой типа того, что в мышки втыкают.
- Йокарный
@silpol, @bealex с выходом N900 интерес к линуху заметно возрос. Тут ещё вот проблема есть примерно следующего свойства: тАк вот, чтобы чек распознать, а потом ещё и автомагически классифицировать - в такое очень слабо верится - ну или на каких-то нев3нно неначальных этапах (поправьте меня, пожалуйста =). А когда всё равно потом ручная обработка на входе в систему, то будет ли от OCRа ощутимый бенефит для юзера?
- Count Caturday
@bealex как в первую очередь альтернативу ношению чеков - мысль прикольная. Можно сравнить рынок по ёмкости со сканерами визитог
- Count Caturday
@bleys "Заметно вырос" — это немного смешно. На 0.001%? Учитывая цену дивайса, даже я, который действительно очень серьезно заинтересовался, покупать N900 не собираюсь. А про классификацию чеков — сделать на дивайсине пять кнопок "магазин/бар/одежда/блаблабла". Приложил, кнопку нажал — оно классифицировалось, отсканилось, дата запомнилась. А если нарисовать кружок и прикладывать ценой к кружку — потом с распознаванием справится даже могильник (или сам дивайс). Получается что-то вроде ГПСа для чеков :-)
- Йокарный
@bealex кстати ведь да, при фотографировании камерафоном тоже можно прицел нарисовать типа "put the sum into this box" , а классифицирующих кнопок - так и вовсе целых 10, всё равно они там уже есть... отдельные части чека, если вдруг относятся к другим категориям, можно фотографировать отдельно (или сканировать, если в случае девайса =), наводя кружком на стоимость конкретной позиции
- Count Caturday
ну, кстати: большинство девайсов, которые были у меня в руках, действительно не могли фотографировать буквы или цифры так, чтобы они читались (так близко не зумится)
- orie
@bealex что касается GPS-а для чеков, то за пределами моллов штатного GPS-а должно хватить, чтобы достаточно надёжно угадать магазин.
- אלף
Одна проблема со съёмкой чека: чек зачастую состоит из нескольких строк...
- Ukc-F
@alf Это-то ладно, но вот как ввести чек из Ленты в 20 позиций автоматически я себе не представляю.
- Ukc-F
длинные чеки пусть дома сканируют. слайд-сканером ;)
- orie
снимать их на видео и дальше по кадрам путь ocr'ит
- baton
from IM
а что такое короткие чеки? У меня вот, пожалуй, короткие чеки -- только из общепита. Редко где я покупаю только что-то одно. Ну, ещё одёжные магазины и обувные, но там я редко бываю, это не интересно. А любой продуктовый или хоз-быт магазин -- это всегда от 3 до 30 позиций, и это 95% чеков.
- Ukc-F
@pashky Про bell103 м xmodem -- это что, ПРАВДА!? Такая перефирия ЕСТЬ?!
- Ukc-F
@pashky apple -- зло. Тратить столько ресурсов, когда вов сех нормальных девайсах есть USB host.. НЕНАВИСТЬНЕНАВИСТЬНЕНАВИСТЬ
- Ukc-F
@pashky И чем поможет soft-modem на j2me S40? :)
- Ukc-F
@pashky Т.е. софт-модем ничуть не универсальнее, IMHO.
- Ukc-F
Для этого должна быть достаточная вычислительная мощность j2me + аудироазьём с записью (есть не везде, далеко не везде)... Или я чего-то не понимаю.
- Ukc-F
@silpol вообще, ничего нормальнее serial пока не придумали. USB всё же тербует уже достаточно дорогих uC или доп. чипов (которые в большинстве своём сделают тебе тот же Serial, завёрнутый в USB).
- Ukc-F
@blacklion у последовательного порта проблемы с потерей символов, если ты делаешь power save -- т.е. ЛИБО экономия батарей, либо rs232
- A. T.
@silpol Какая экономия батарей когда мы ещё и перефирию типа сканера питаем? Тут уж не до экономии.
- Ukc-F
@blacklion фокус power management в том, что он должен быть везде... мы можем палить батарею на то и на это - но pm должен работать, всегда и везде... кстати, это ВЫ себе там сканер приделывает через rs232, я спокойно обойдусь макрорежимом камеры...
- A. T.
@silpol Ну вот у меня uC тут лежит. Так он может вообще 1 микроампер на 3.3 вольта потреблять и при этом байты с UART'а не терять. Потому что UART питается отдельно и будит собственно контроллер только по полному байту. Какие-такие конфликты между RS232 и PM? Ась?
- Ukc-F
Ну и таки я всё ещё не понимаю юзкейса. Макрорежим не спасёт на длинном чеке (да и распознать его задача не из простых, решена ли она уже где-нибудь?) а короткий чек из одного числа проще ввести руками. Лень-то именно пол-метра бумаги из Ленты вводить, а не 1 число.
- Ukc-F
@blacklion наши бойцы из NRC делали распознавание в макрорежиме - неидеально, но работало (им для research concept proof хватало)... видел сам - брали дли-и-иный чек из супермаркета и тупо проводили над ним, на глаз соблюдая только чтобы лента на экране не выходила за рамки, DSP "живьем" считал с задержкой 2-3 секунды... работало при мерзком освещении, при разных углах, с засаленным пальцами "обьективом", умело выявить колонки с названиями и суммами, делало educated guess на предмет totals & subtotals...
- A. T.
@silpol классная штука, как я понимаю. Это ж скока там логики понапихато. OS?
- Count Caturday
@silpol Круто. Хочу такое видеть вживую...
- Ukc-F
Это никогда не заработает на русском языке, как до сих пор делает распознавалка визиток Е71.
- i'm a ninja
@corvalol чем же русские чеки так сильно отличаются от финских?
- Count Caturday
А чем русские визитки отличаются от финских? Я тоже думаю, что ничем. Однако визитка, лежащая на столе и никуда, в отличие от чека, не двигающаяся, распознаётся так, что хочется в ужасе выбежать из комнаты и умереть от разочарования в человечестве.
- i'm a ninja
@corvalol а вы на финских визитках проверяли?
- Count Caturday
Нет, но если оно даже и финские не распознаёт, то как этот бинарный код вообще могли назвать продуктом?
- i'm a ninja
@corvalol если оно так, получится совершенно отдельная дискуссия
- Count Caturday
В любом случае, с русскими сие не работает. Чеки распознавать сложнее, чем визитки. Делаю вывод, что и оно работать не будет.
- i'm a ninja
@dstillermann я вот нифига не понимаю, почему какую-то распознавалку визитог их E71 сравнивают с независимой NRC разработкой под другую платформу
- Count Caturday
@corvalol то, что показывали нам, увы было даже не бетой а proof of concept... болле того, мне трудно было бы сказать попадет ли оно когда-либо в конечный продукт... оно точно было S60 - был один из наших крайних на тот момент телефонов, и оно работало _в_моих_кривых_руках_ - из 7 чеков что я нашел у себя в карманах (мятых до состояния шарика в кармане) оно прочитало ВСЕ, 2 или 3 со 2й попытки... ребята НЕ делали продукт - вывод шел на ноутбук (там же показывало как оно распознает).
- A. T.
было 3 или 4 варианта для демо - один на самом ноуте, один в каком-то "вражеском" телефоне, один на чистом ARM процессоре внутри S60 и один "смесь DSP+ARM" внутри S60. Только ноутовый и "смесь" варианты работали в приемлимое время, остальное дико тормозило, сбивалось, етц. Ребята говорили что очень немногие телефоны на тот момент умели нужный уровень макро в оптике, поэтому don't do it at home.
- A. T.
координат я не оставлял - оно было за пределами моих интересов, и вообще я питаю надежду что 1 day заопенсорсят Ritescript и будет всем щасте.
- A. T.
Я был бы только рад увидеть такое живым на своём смарте. Надеюсь, что так и будет когда-нибудь.
- i'm a ninja
Must have: вылизанный до совершенства воркфлоу по вводу транзакций (включая вменяемый автокомплит, но не создающий проблемы, как в GNUCash), splits, вменяемый импорт банковских отчётов, некорявый reconciliation, иерархия счетов (как в GNUCash например). Очень хотелось бы: скриптинг (да хоть с тем же Scheme) с вменяемым API и доступностью всех данных, сканирование чеков.
- Ещё быстрей Гонсалес