Tesseract適用於僅包含文本的圖像 - 裁剪圖像僅獲取圖像中的文本部分

Tesseract適用於僅包含文本的圖像。但是，如果有文字和圖像，我們只想得到文本被識別。Tesseract適用於僅包含文本的圖像 - 裁剪圖像僅獲取圖像中的文本部分

我正在使用Tesseract進行圖像文本的OCR識別。 Tesseract正在給那些只有文本的圖像提供確切的文字。但是，當我檢查包含汽車和它的車號的圖像時，Tesseract給出了不同的車號亂碼文本。我應用了灰度級優化，閾值和其他效果來獲得精確的文本輸出並提高了輸出的準確性，但它仍然給不同的文本混合不同的編碼。同樣，我正在尋找其他方法來提取這些文本。

誰能知道怎麼去使用的Tesseract OCR或任何其他這樣的圖像文本，以便只有文字部分保留圖像，這樣的Tesseract可以給輸出的確切文本。

裁剪圖像是獲取唯一文本的一種替代方法，但是如何使用ImageMagick或任何其他選項來執行此操作。

謝謝。

來源

2012-11-28 My God

如果你知道確切位置的圖像文字，你可以隨着圖像的區域的座標發送到正方體的認識。看看Tesseract API方法TesseractRect或SetRectangle。雖然我想任何OCR檢測從圖像文本更另一種方式是指雖然我檢查GOCR/JOCR，OCRopus和正方體，但他們有同樣的問題

來源

2012-11-30 02:02:59 nguyenq

您的答覆是值得考慮的。但是如果你不知道文字在圖像上的位置怎麼樣，因爲它可能是從相機拍攝，就像識別汽車的車號一樣。 –

Tesseract適用於僅包含文本的圖像 - 裁剪圖像僅獲取圖像中的文本部分

回答

相關問題