TL; DR看來tesseract無法識別由單個數字組成的圖像。有沒有解決方法/原因呢?有沒有辦法使用tesseract單個數字的數字?
我正在使用(僅數字版本)tesseract來自動向系統輸入發票。然而,我注意到,正方體似乎是無法識別的個位數,如下列:
作物後的原始掃描:
我做了一些圖像增強後:
它工作正常,如果它至少有兩個數字:
我一對夫婦的其他數據進行測試:
不工作: ,
,
工作: ,
,
如果有幫助,爲了我的目的,tesseract的所有輸入都按照上面的方式裁剪和旋轉。我使用pyocr作爲我的項目和tesseract之間的橋樑。