我需要檢索存儲爲一系列圖像的大量舊數據。它們都具有相同的背景和文字顏色,都使用相同字體大小的Verdana。事情是這樣的:OCR預先知道字體的圖像
我已經試過在一列被計數的像素和單個字形匹配到我的前面「編碼」字形的數據庫。工作很不錯,但有兩個主要問題
1)keming - 分離字形我檢查如果我打字符之間的空間。當兩個字符重疊時這不起作用。我通過在我的數據庫中添加所有字母組合來解決這個問題。 2)別名 - 這是我最終的問題 - 單個字母可以用許多不同的方式查找,因爲別名,幾乎每個別名情況都看起來獨一無二,所以我不能建立「那些看起來像A的數據庫」,而不會完全改變我的識別代碼方法
所以:是否有一種工具可以識別處理別名的圖像上的特定字體?
我會很感激不是用正方體其他的解決辦法,這是我最後的選擇,因爲複雜性和重量