我使用Tesseract(一個OCR庫)構建一個iOS應用程序(拍攝照片並運行OCR),它使用良好的數字和字符(使用常用字體)很好地工作。7段顯示OCR
我遇到的問題是,如果我在7段顯示器上嘗試它,它會給出非常糟糕的結果。
所以我的問題是:有誰知道我該如何解決這個問題? Tesseract能否識別這些角色?
我使用Tesseract(一個OCR庫)構建一個iOS應用程序(拍攝照片並運行OCR),它使用良好的數字和字符(使用常用字體)很好地工作。7段顯示OCR
我遇到的問題是,如果我在7段顯示器上嘗試它,它會給出非常糟糕的結果。
所以我的問題是:有誰知道我該如何解決這個問題? Tesseract能否識別這些角色?
我也很難讓tesseract識別液晶顯示器圖像中的數字。
$ composite -compose Multiply -geometry +0+3 foo.tif foo.tif foo2.png
在端:
我通過預處理與ImageMagick中的圖像,以在其自身上疊加圖像的副本有輕微的垂直移位到段之間填補空白有一些邊際成功儘管如此,我的存儲優雅是「七段光學字符識別」二進制:http://www.unix-ag.uni-kl.de/~auerswal/ssocr/
非常感謝作者Erik Auerswald爲此代碼!
如何在iOS上運行ssocr? – phnmnn 2016-05-03 21:00:44
你是如何在android中使用的? – 2016-05-19 04:46:14
我還沒有嘗試OCRing 7段顯示,但我懷疑問題可能是由字符不是連接組件造成的。 Tesseract不能很好地處理我的經驗中斷開的字體。
簡單侵蝕(圖像預處理)可能有助於連接細分,但您必須測試它並使用內核大小來防止太多失真。
是的,我知道。我試着着色像素自己只是嘗試OCR上的圖片(帶連接數字),它仍然沒有奏效。可能是因爲字體很奇怪,所以我正在努力處理字體。 Thx for your answer anw :) – Karim 2012-02-20 12:54:05
然後,使用該字體訓練tesseract。在拼接細分之後使用字體可能會更好,但是您最好嘗試兩種方法(使用原始字體和連接的字體進行訓練),以查看哪個更好。 – 2012-02-20 12:56:08
有趣的是,(不管這個特定包),它是非常容易識別的7個文字 - 簡單的圖像處理 - 邊緣檢測,然後找到長度和方向給您帶來中途 – Ofir 2012-02-20 12:44:36