2016-11-29 57 views
1

我正在嘗試提高諸如日文/中文字母等複雜字母的識別率。細化字母的邊緣以僅保留OCR的字母中心

應該做什麼樣的圖像處理來使左邊的字母變成右邊的字母?

這個想法是保持字母的中心(我不知道該怎麼稱呼它),爲了使字母更加清晰,所以OCR(如Tesseract)的識別率會提高。

如果還有另一種方法來提高這種複雜字母的識別率,那麼最好也要知道。

Sample letter

回答

1

您正在尋找Skeletonization可與morphological operators OpenCV中或Scikit,圖片或MATLAB來完成。另一個選項是distance transform,然後是閾值,如OpenCV Watershed example所示。

+0

僅對幾個像素粗線條進行形態學操作將無濟於事,因爲它會扭曲形狀(縮短線條),這可能會改變形狀線條比率以避免識別。 – Spektre

+0

形態操作需要二值圖像,因此閾值可能是強制性的。 – Trilarion