1
我正在嘗試提高諸如日文/中文字母等複雜字母的識別率。細化字母的邊緣以僅保留OCR的字母中心
應該做什麼樣的圖像處理來使左邊的字母變成右邊的字母?
這個想法是保持字母的中心(我不知道該怎麼稱呼它),爲了使字母更加清晰,所以OCR(如Tesseract)的識別率會提高。
如果還有另一種方法來提高這種複雜字母的識別率,那麼最好也要知道。
我正在嘗試提高諸如日文/中文字母等複雜字母的識別率。細化字母的邊緣以僅保留OCR的字母中心
應該做什麼樣的圖像處理來使左邊的字母變成右邊的字母?
這個想法是保持字母的中心(我不知道該怎麼稱呼它),爲了使字母更加清晰,所以OCR(如Tesseract)的識別率會提高。
如果還有另一種方法來提高這種複雜字母的識別率,那麼最好也要知道。
您正在尋找Skeletonization可與morphological operators OpenCV中或Scikit,圖片或MATLAB來完成。另一個選項是distance transform,然後是閾值,如OpenCV Watershed example所示。
僅對幾個像素粗線條進行形態學操作將無濟於事,因爲它會扭曲形狀(縮短線條),這可能會改變形狀線條比率以避免識別。 – Spektre
形態操作需要二值圖像,因此閾值可能是強制性的。 – Trilarion