2014-03-28 116 views
0

我試圖實施tesseract(tess-two)來讀取一個ID或支票的數據。有人能做到嗎?我當時遇到問題以識別文本。結果有很多額外的字符Tesseract OCR閱讀ID爲Android

回答

0

在我使用Tesseract OCR的經驗中,我發現如果將圖像轉換爲字節二進制(像素爲黑色或白色),我會得到更好的結果。當有高對比度時,OCR引擎會更好地工作。有關如何將Android位圖轉換爲二進制圖像的信息,請查看此問題(Android: Convert Grayscale to Binary Image)。

此鏈接解釋了爲什麼黑白圖像會更好地工作,並且還提到了其他提高OCR準確性的方法(https://marinersoftware.deskpro.com/kb/articles/294-which-steps-can-be-taken-to-improve-the-accuracy-of-ocr-results-in-paperless)。

雖然預處理輸入圖像會提高準確性,但對後處理輸出文本也可能有所幫助。

+0

我對文字有很好的認識。但是我必須對已經被IOS或者Androir使用的鏡像做一些修改。之後,我得到一大堆額外的字符。我曾嘗試過OCRTest,因爲我只需要獲取ID的一部分。但即使使用示例(Android的OCRTest),我也會得到額外的字符甚至無法識別的行。你使用過任何教程嗎? –

+0

查看本教程(http://rmtheis.wordpress.com/2011/08/06/using-tesseract-tools-for-android-to-create-a-basic-ocr-app/)。此外,嘗試使用大字母和黑白配色方案的圖像,如此(http://data2.whicdn.com/images/13725579/large.jpg),並查看輸出文字的樣子。 – ashwin153