2012-11-28 57 views
1

Tesseract適用於僅包含文本的圖像。但是,如果有文字和圖像,我們只想得到文本被識別。Tesseract適用於僅包含文本的圖像 - 裁剪圖像僅獲取圖像中的文本部分

我正在使用Tesseract進行圖像文本的OCR識別。 Tesseract正在給那些只有文本的圖像提供確切的文字。但是,當我檢查包含汽車和它的車號的圖像時,T​​esseract給出了不同的車號亂碼文本。我應用了灰度級優化,閾值和其他效果來獲得精確的文本輸出並提高了輸出的準確性,但它仍然給不同的文本混合不同的編碼。同樣,我正在尋找其他方法來提取這些文本。

誰能知道怎麼去使用的Tesseract OCR或任何其他這樣的圖像文本,以便只有文字部分保留圖像,這樣的Tesseract可以給輸出的確切文本。

裁剪圖像是獲取唯一文本的一種替代方法,但是如何使用ImageMagick或任何其他選項來執行此操作。

謝謝。

回答

2

如果你知道確切位置的圖像文字,你可以隨着圖像的區域的座標發送到正方體的認識。看看Tesseract API方法TesseractRectSetRectangle。雖然我想任何OCR檢測從圖像文本更另一種方式是指雖然我檢查GOCR/JOCR,OCRopus和正方體,但他們有同樣的問題

+0

您的答覆是值得考慮的。但是如果你不知道文字在圖像上的位置怎麼樣,因爲它可能是從相機拍攝,就像識別汽車的車號一樣。 –