2015-03-31 242 views
4

我正在研究一個需要精確OCR結果的項目,以獲得具有豐富背景的圖像。所以我比較兩個OCR(其中一個是Tesseract)的結果來做出我的選擇。重點是結果受到預處理步驟以及特別是圖像二值化的強烈影響。我提取了另一個OCR的二值化圖像,並將其傳遞給Tesseract,將Tesseract的結果增強了30-40%。在Tesseract OCR中使用什麼閾值(二值化)算法?

我有兩個問題,你的答案會是有很大幫助對我說:

  1. 什麼二進制算法做正方體易用,它配置?
  2. 有沒有辦法提取Tesseract OCR的二值化圖像,所以我可以用它測試其他OCR?

感謝提前:)

回答

6

我想我已經找到了答案,我的問題:

1中使用的二值化算法Otsu分割。你可以看到它在here 179線

2 - 要獲得二值圖像,在正方體API的方法可以被稱爲:

PIX* thresholded = api->GetThresholdedImage(); //thresholded must be freed 
3

Otsu分割是一個全球性的過濾器。你可以使用一些本地過濾器來獲得更好的結果。 您可以查看Sauvalo的二進制化,請參閱here或Nick的here。這兩種算法都是Niblack的改進。 我用它來對我的圖片進行二值化處理以獲得更好的效果 祝你好運