改進Tesseract OCR中的預處理步驟以實時捕獲

我正在使用Tesseract庫閱讀身份證信息。我嘗試過使用一些Google images並取得了很好的效果，但是當我使用實時圖像時，即從iPhone相機拍攝圖像時，我沒有得到好的結果。改進Tesseract OCR中的預處理步驟以實時捕獲

我發現了Tesseract建議的一些預處理步驟。

1.修復DPI（如果需要）300 DPI最小。

如何在iPhone攝像頭實時捕捉圖像時設置圖像的DPI？

2.修正文字大小（例如12點應該沒關係）。

如何解決由iPhone攝像頭創建的大圖像的文本大小？

3.嘗試修復文本行（歪斜和扭曲文本）。

我讀到Tesseract使用Leptonica庫應用dewarp文本。在這個預處理階段，文本需要dewarp或deskew。

4.嘗試修復圖像的照明（例如，沒有圖像的黑暗部分）。

我可以使用OpenCV執行圖像照明嗎？

5.二值化和去噪圖像。

當我爲實時圖像應用閾值或自適應閾值時，我得到的二值化圖像質量很差。

如何二值化這些實時圖像？

1. 和2：當文本具有12的點尺寸，這意味着它在72 DPI佔用高度的12個像素。在300 DPI這是大約50個像素。所以你應該從1和2中拿出來，就是你應該試着對拍攝的圖像進行分辨率處理，使得文本的線條高度爲50像素左右。你如何做到這一點取決於你如何捕捉圖像。
這是比較容易要求用戶握住照相機直:-)
和5。。你可以嘗試應用一些過濾。同樣，要求使用確保適當的照明應用可能會更容易。

2015-04-24 21:26:19

回答