我正在研究一個需要精確OCR結果的項目,以獲得具有豐富背景的圖像。所以我比較兩個OCR(其中一個是Tesseract)的結果來做出我的選擇。重點是結果受到預處理步驟以及特別是圖像二值化的強烈影響。我提取了另一個OCR的二值化圖像,並將其傳遞給Tesseract,將Tesseract的結果增強了30-40%。在Tesseract OCR中使用什麼閾值(二值化)算法?
我有兩個問題,你的答案會是有很大幫助對我說:
- 什麼二進制算法做正方體易用,它配置?
- 有沒有辦法提取Tesseract OCR的二值化圖像,所以我可以用它測試其他OCR?
感謝提前:)