2015-12-19 108 views
1

我有一個python腳本可以掃描收據,然後將其輸出到掃描文件中。在新文件上使用tesseract imagefile輸出文件。我可以得到很好的可讀文本,但解析如下所示。有沒有辦法使用tesseract在價格旁邊排列購買的物品?我的首選是使用PHP或Python。Python/PHP Tesseract輸出優化技巧

WHELE 
POODS .4 
M 

Merchant Name and Address 

365 BHCON LS 

365 BHCON LS 

365 BHCON LS 

365 BHCON LS 
BROTH CHIC 

FLOUR HLHONO 

CHKN BRST BNLSS SK 
HEAVY CREHH 

BHLSHC REOUCT 

BEEF GRND 85/1§« 
JUICE COF CHSHEU C 

i . DOCS PINT ORGRNIC 

NP 4.99 
NP 4.99 
NP 4.99 
NP 4.99 
NP 2.19 
NRuqfl1.99 
NP 18.80 
NP 3.39 
NP §.49 
NP ’.04 
NP ‘f:,99 
NP 14.49 

HNY HLMONO BUTTER NP 9.99 

**** TEX .00 BRL 
+0

您可以把圖片放在這裏?它可以改善使用OpenCV「清理」圖像的讀數。 – Macabeus

回答