在Tesseract OCR中使用什麼閾值（二值化）算法？

我正在研究一個需要精確OCR結果的項目，以獲得具有豐富背景的圖像。所以我比較兩個OCR（其中一個是Tesseract）的結果來做出我的選擇。重點是結果受到預處理步驟以及特別是圖像二值化的強烈影響。我提取了另一個OCR的二值化圖像，並將其傳遞給Tesseract，將Tesseract的結果增強了30-40％。在Tesseract OCR中使用什麼閾值（二值化）算法？

我有兩個問題，你的答案會是有很大幫助對我說：

什麼二進制算法做正方體易用，它配置？
有沒有辦法提取Tesseract OCR的二值化圖像，所以我可以用它測試其他OCR？

感謝提前:)

來源

2015-03-31 Baraa

我想我已經找到了答案，我的問題：

1中使用的二值化算法Otsu分割。你可以看到它在here 179線

2 - 要獲得二值圖像，在正方體API的方法可以被稱爲：

PIX* thresholded = api->GetThresholdedImage(); //thresholded must be freed

來源

2015-04-01 07:32:44 Baraa

Otsu分割是一個全球性的過濾器。你可以使用一些本地過濾器來獲得更好的結果。您可以查看Sauvalo的二進制化，請參閱here或Nick的here。這兩種算法都是Niblack的改進。我用它來對我的圖片進行二值化處理以獲得更好的效果祝你好運

來源

2016-06-12 18:28:15

在Tesseract OCR中使用什麼閾值（二值化）算法？

回答

相關問題