2014-09-05 78 views
7

我正在使用Tesseract庫閱讀身份證信息。我嘗試過使用一些Google images並取得了很好的效果,但是當我使用實時圖像時,即從iPhone相機拍攝圖像時,我沒有得到好的結果。改進Tesseract OCR中的預處理步驟以實時捕獲

我發現了Tesseract建議的一些預處理步驟。

1.修復DPI(如果需要)300 DPI最小。

如何在iPhone攝像頭實時捕捉圖像時設置圖像的DPI?

2.修正文字大小(例如12點應該沒關係)。

如何解決由iPhone攝像頭創建的大圖像的文本大小?

3.嘗試修復文本行(歪斜和扭曲文本)。

我讀到Tesseract使用Leptonica庫應用dewarp文本。在這個預處理階段,文本需要dewarp或deskew。

4.嘗試修復圖像的照明(例如,沒有圖像的黑暗部分)。

我可以使用OpenCV執行圖像照明嗎?

5.二值化和去噪圖像。

當我爲實時圖像應用閾值或自適應閾值時,我得到的二值化圖像質量很差。

如何二值化這些實時圖像?

回答

1
    1. 和2: 當文本具有12的點尺寸,這意味着它在72 DPI佔用高度的12個像素。在300 DPI這是大約50個像素。所以你應該從1和2中拿出來,就是你應該試着對拍攝的圖像進行分辨率處理,使得文本的線條高度爲50像素左右。你如何做到這一點取決於你如何捕捉圖像。
  • 這是比較容易要求用戶握住照相機直:-)
  • 和5。 。你可以嘗試應用一些過濾。同樣,要求使用確保適當的照明應用可能會更容易。