Q

C++：Tesseract調整，以消除嘈雜的元素

2016-01-29 53 views 2 likes

2

我想對圖像做一些預處理，以獲得一些文本，但不幸的是，仍然有一些「嘈雜」的元素卡在圖像上，他們妥協OCR。C++：Tesseract調整，以消除嘈雜的元素

處理後的圖像：

的主要目標將是隻保留文字和移除左側的小黑線：

沒有人有一個想法怎麼做？

謝謝你的幫助。

2016-01-29 Robert Jones

+0

嘗試使用文本檢測算法，也許MSER（從未使用過它），然後得到一個邊框，和工作從那裏 –

A

回答

1

首先，對圖像施加侵蝕（可能需要試驗內核的大小）。之後，擴張結果恢復。

對於非常粗的線條/像素噪點，您還應該在其上應用中值模糊。

2016-01-29 10:52:44 tomekpe

+0

與擴張的問題是，即使使用Size（2; 2）最小的內核和交叉形態，也會刪除大量重要字符。我猜這些字母已經太薄了，無法用擴張處理... –

2

可以使用筆畫寬度變換

2016-01-29 11:15:23 orkan

相關問題