我想對圖像做一些預處理,以獲得一些文本,但不幸的是,仍然有一些「嘈雜」的元素卡在圖像上,他們妥協OCR。C++:Tesseract調整,以消除嘈雜的元素
處理後的圖像:
的主要目標將是隻保留文字和移除左側的小黑線:
沒有人有一個想法怎麼做?
謝謝你的幫助。
我想對圖像做一些預處理,以獲得一些文本,但不幸的是,仍然有一些「嘈雜」的元素卡在圖像上,他們妥協OCR。C++:Tesseract調整,以消除嘈雜的元素
處理後的圖像:
的主要目標將是隻保留文字和移除左側的小黑線:
沒有人有一個想法怎麼做?
謝謝你的幫助。
首先,對圖像施加侵蝕(可能需要試驗內核的大小)。之後,擴張結果恢復。
對於非常粗的線條/像素噪點,您還應該在其上應用中值模糊。
與擴張的問題是,即使使用Size(2; 2)最小的內核和交叉形態,也會刪除大量重要字符。我猜這些字母已經太薄了,無法用擴張處理... –
可以使用筆畫寬度變換
嘗試使用文本檢測算法,也許MSER(從未使用過它),然後得到一個邊框,和工作從那裏 –