2014-02-27 74 views
0

有沒有辦法用ImageMagick處理像this這樣的圖像,以便我可以使用tesseract-ocr將其轉換爲文本?ImageMagick預處理用於tesseract-ocr的圖像

由於背景中的線條,我從傳統方法中獲得了無稽之談。有誰知道如何處理像這樣的圖像?

'convert -density 300 -units PixelsPerInch -type Grayscale + compress input.png input.tif'後面跟着'tesseract input.tif output -l eng'給了我絕對的垃圾。

或者是否有任何替代ImageMagick,我可以用來預處理這樣的圖像,無論是通過命令行或在Python中?

回答