我一直在嘗試使用圖像處理腳本/ OCR,這將允許我從下圖中找到的框中提取字母(使用tesseract
)。使用OpenCV OCR對圖像進行銳化
繼處理了很多,我能得到的圖片看起來像這樣
爲了消除噪音我倒的圖像,然後floodfilling和高斯模糊去除噪音。這就是我接下來的結果。
通過一些threholding和侵蝕運行它來消除噪聲(糜爛是歪曲文本中的步驟)我能得到的圖像看起來像這樣通過正方體運行它之前之後
這是一個非常好的渲染,可以通過tesseract獲得相當準確的結果。雖然它有時會失敗,因爲它將哈希(#)作爲H或W讀取。這使我想到了我的問題!
有沒有一種方法使用opencv,skimage,PIL(opencv優先)我可以銳化這個圖像,以增加我tesseract正確閱讀我的形象的機會?或者有沒有一種方法可以從第三張圖像到最終圖像,而不必使用最終扭曲圖像中文字的侵蝕。
任何幫助將不勝感激!
你可以分享你已經做了哪些預處理嗎? – Dabo
我添加了幾個導致我所指的失真的關鍵步驟:) – JamesLLee
[圖像處理和提取字符]的可能重複(http://stackoverflow.com/questions/20427759/image-processing-and-字符提取) – karlphillip