我希望有人能告訴我爲什麼它是我的Tesseract在識別一些帶有數字的圖像時遇到問題,並且如果有什麼我可以處理的話。 一切都按照測試工作,因爲它只是我需要的數字,我以爲我可以用英文模式來管理,直到我不得不從7分段顯示器開始。在Tesseract中識別數字時遇到問題 - android
儘管我在附加圖像上遇到了很多麻煩,但是我想知道是否應該開始研究自己的識別算法,或者如果我可以爲Tesseract創建自己的數據集,然後工作,任何人都知道Tesseract的侷限性在哪裏?
嘗試過的東西: 試圖將psm設置爲one_line,one_word,one_char(並截取圖片)。使用one_line和one_word時,沒有顯着變化。 與one_char它確實認識到了一點好,但有時,由於間距太大,它附加了一個額外的數字,然後擰它,如果你看看附加的圖像然後它導致04. 我也試過自己進行二值化,這導致了較差的識別並且非常消耗資源。 我試圖倒置圖片,這對tesseract完全沒有任何影響。
我附上了需要處理的圖片等等。
釋有關圖片:
是一個形象的正方體有就認出,雖然它在字已作出建設圍繞工作圖像的應用程序的便利。
是與image_seven匹配的真實生活圖片。但它無法識別這一點。
是我想讓它識別的另一個圖像,是的,我知道它不能被skrewed,而且我做了unskrew(認爲skrew是這裏的術語==「直接」)。
skrew = skew nice :)。此外,圖像工具集可以減少噪音,銳化,而不是。這可能有助於 – 2014-06-05 18:43:53