2015-01-09 174 views
2

我在我的android應用程序中使用this進行OCR。Android tesseract OCR改進結果

我正在使用默認相機應用程序拍攝照片並將相同圖像送入tesseract庫。我目前使用this示例項目。當我處理任何圖像時,我會得到不準確的結果以及許多隨機的單個字母。我看了很多帖子,發現我需要對我拍的照片做一些預處理,所以請幫助我。任何關於圖像處理的詳細說明都將非常有用。

謝謝。

This is the sample image

+0

所需的樣本圖像。 –

+0

我想將它用於從書中提取的任何照片,我仍然會提供樣本圖像。 – nihartrivedi810

+2

這張圖片有兩個可能的問題:1)JPEG壓縮嚴重損壞(是否用於OCR?); 2)看起來不太清晰,我懷疑運動模糊(但由於1,很難說)。這種字體(Times?)不會因爲地方的筆畫變薄而遭受這種降級。運動模糊的最佳治療方法是:牢牢抓住相機。 –

回答

1

我通過將閾值濾波一個相當不錯的結果(85%)。

請注意,您的輸入圖像不是最好的。

  • 它是模糊
  • 似乎有從通過
  • 頁面來頁的背面文字是一個角度

如果你能保證頁面頭戴式沒有文字從下面的頁面流血,並且圖像被聚焦,那麼您應該在使用OpenCV進行Tesseract之前應用Otsu或自適應閾值。我有更好的結果往往表演我自己的閾值不是將其留給正方體

http://docs.opencv.org/trunk/doc/py_tutorials/py_imgproc/py_thresholding/py_thresholding.html

+0

我允許用戶從相機拍攝圖像,我如何施加這種限制。 – nihartrivedi810

+1

你不可能真的 - 你需要教育你的用戶作爲入職過程的一部分。對於模糊提供點擊對焦,對於非流血提供矩形疊加層,用戶必須對其進行框架設置,以便強制使用邊距並防止出現角度 - 您需要在幫助用戶進行原始輸入時獲得創意真的很好。 – PorridgeBear