問題:大約一週前,爲了更好地改進Tesseract的準確性,我添加了高斯模糊/ OTSU二值化組合,從而生成漂亮的二進制圖像,如附件。我在openCV中這樣做,所以我傳遞給Tesseract的圖像已經是一個二進制圖像(如附圖所示)。當Tesseract對圖像進行預處理時(即使是下面發佈的圖像),圖像也會被破壞,因此不會產生有意義的輸出。請參閱示例輸入下方的圖像,瞭解Tesseract對圖像所做的事情。OpenCV高斯模糊打破Tesseract?
問題的根源在於高斯模糊。如果我刪除它,那麼tesseract輸出的Thresholded image
不是亂碼,但它也不像我附加的二進制映像那樣乾淨可讀。我可以禁用Tesseract預處理我傳遞的圖像嗎?爲什麼高斯模糊完全毀了Tesseract?我感覺好像輸入圖像和我所附的圖像一樣清晰,準確性會提高。
兩張圖片都是同一列。首先是輸入圖像,其次是Tesseract圖像預處理的結果。
輸入到超正方體實施例:
超正方體損壞(來自GetThresholdedImage()
獲得:
好吧,這幫了很多!因此,閾值圖像是一串水平線,所以出現了一些錯誤。我最終將其追蹤到,事實上,我確實在二值化之前爲圖像添加了高斯模糊以改善圖像。但模糊和二值化的結果就像上面提到的那樣^^。一個完美的二值化圖像如何破解tesseract?我知道tesseract也嘗試對圖像進行二值化處理,但是在測試之後,我的圖像更加清晰。有任何想法嗎? –
AFAIK tesseract不會二值化2色圖像。所以我想如何將opencv數據傳遞給tesseract存在問題。我發佈了適用於我的示例。 – user898678