我試圖使用Tessaract從收據和賬單中提取數據,我正在使用tesseract 3.02版本。Tesseract訓練數據
上午只使用英文數據,仍然輸出精度約爲60%。
是否有可用的任何訓練有素的數據,我只需更換tessdata文件夾
我試圖使用Tessaract從收據和賬單中提取數據,我正在使用tesseract 3.02版本。Tesseract訓練數據
上午只使用英文數據,仍然輸出精度約爲60%。
是否有可用的任何訓練有素的數據,我只需更換tessdata文件夾
這是一個「典型的示例文件」提供的圖像尼基在:
看着它,我會明確地說:「忘記它,尼克!你無法訓練Tesseract識別這種類型的圖像100%的文本!」
然而,你可以訓練自己做出更好的照片與的iPhone 3GS(這就是它被用於例如圖像的裝置)從這種類型的收據。以下是一些提示:
也就是說,像下面的ImageMagick命令將可能有一定程度的增加正方體的識別率:
convert \
http://i.stack.imgur.com/q3Ad4.jpg \
-colorspace gray \
-rotate 90 \
-crop 260x540+110+75 +repage \
-scale 166% \
-normalize \
-colors 32 \
out1 .png
它產生以下輸出:
你甚至可以添加如-threshold 30%
作爲最後的命令行選項到上面的命令得到這個:
(你應該打幾分有一些變化的30%
值來調整結果...我沒有這個時間。)
從tesseract獲取收據的準確信息是不可能的。您需要添加圖像過濾器和一些其他工具,例如OpenCV,NumPy ImageMagick以及Tesseract。 Franck Chastagnol在PyCon 2013上做了演講,他描述了他的公司是如何做到的。
這裏是鏈接: http://pyvideo.org/video/1702/building-an-image-processing-pipeline-with-python
正是我需要同樣的事情,我嘗試了一些圖像的優化,以提高輸出
你可以找到我的實驗tessaract這裏
在使用Tesseract對文本進行OCR之前,您可以獲得更清晰的後處理圖像。嘗試使用背景表面閾值(BST)技術,而不是其他簡單的閾值方法。你可以找到關於here的白皮書。
有是非常有效的BST的OpenCV實現https://stackoverflow.com/a/22127181/3475075
是的,我有我最新版本,不過輸出是不好的。 – nicky
如果您不提供至少一個(鏈接到)典型示例文件,則無法告訴您如何提高準確性。 –
這是圖像 – nicky