2015-11-25 82 views
0

我創建了下面的代碼並執行提取JPG文件數值:如何使用OCR

Ocr.setUp(); 
Ocr ocr = new Ocr(); 
ocr.startEngine("eng", Ocr.SPEED_FASTEST); 
String s = ocr.recognize(theImage, Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PLAINTEXT); 
ocr.stopEngine(); 

Output: 
Result: L‘i 
L‘L’Ui l 

其實像只包含數值。是否有可能通過使用上面的代碼只提取數字值?

我有1234數值顯示在jpg文件中,我只是想在o/p控制檯中打印該數值。有人可以幫我嗎?

回答

0

我對你的代碼有一些與技術無關的觀察。

  1. 「SPEED_FASTEST」表示您對快速OCR的偏好。快速與高質量相反。你要麼獲得速度或質量。如果圖像清晰 - 沒有問題,但如果圖像不夠完美,質量模式將有更多算法來處理缺陷。
  2. 沒有在您的代碼中指定您只將字符集限制爲數字。如果您未指定語言或字符集,則通常默認使用整個英文字符集。請參閱我對此帖的回覆:OCR why not find only character
  3. 通常,如果您將示例圖像與問題和代碼一起發佈,貢獻者可以給您提供更好的建議。
+0

我沒有任何特權在這裏上傳圖片。但我可以告訴你它是如何的。圖片與徽標類似,包含一些數字字符。你可以告訴我任何解決方案它將非常感謝滿。 – SKumar

+1

實施我的兩個建議下面將解決您的問題。或者,切換到不同的OCR技術,使這些控件開箱即用,以減少實施風險。 –