2013-04-05 89 views
0

我有我的android項目的用戶tesseract ocr識別從攝像頭拍攝的圖像中的文本。但結果不準確。我想使用opencv優化圖像。我想,以實現其在Bitmap.Config.ARGB_8888格式解碼所拍攝的圖像以下:使用tesseract爲文本識別優化圖像

  1. 檢測調整後的圖像中的對象。
  2. 一旦對象被識別,計算它的邊界w.r.t原始圖像。 (這是爲了消除相機角度效應)
  3. 通過應用透視變換從原始圖像中提取對象。
  4. 應用白平衡消除減輕效果。

在通過與tess_two API提供的例子,他們正在使用Leptonica的圖像操作就像畫周圍的words..But邊界框在我的情況下,我想用OpenCV的 ...您的指導將受到高度讚賞...

回答

0

這是很多你要求,並根據對象可能是不可能的。您應該查看關於2D特徵檢測和對象檢測的教程(http://docs.opencv.org/doc/tutorials/features2d/table_of_content_features2d/table_of_content_features2d.htmlhttp://docs.opencv.org/doc/tutorials/objdetect/table_of_content_objdetect/table_of_content_objdetect.html),以查看是否有可用的東西。

白平衡對光照不起任何作用,您應該進行自適應閾值或某種高通濾波。