我正在爲我的項目製作一個使用TessBaseAPI的簡單OCR Android應用程序。我已經完成了一些圖像預處理步驟,如二值化和圖像增強。但他們的結果是50%至60%。我們如何提高識別率?圖片提高識別率的預處理步驟
我包含兩個樣本圖像。
http://imageshack.us/photo/my-images/94/1school.jpg/
http://imageshack.us/photo/my-images/43/15071917.jpg/
我正在爲我的項目製作一個使用TessBaseAPI的簡單OCR Android應用程序。我已經完成了一些圖像預處理步驟,如二值化和圖像增強。但他們的結果是50%至60%。我們如何提高識別率?圖片提高識別率的預處理步驟
我包含兩個樣本圖像。
http://imageshack.us/photo/my-images/94/1school.jpg/
http://imageshack.us/photo/my-images/43/15071917.jpg/
以下增加至上述命令適用於你的第二個圖像:
-negate \
-deskew 40% \
+repage \
-crop 393x110+0+0 \
他們添加的適當水平歪斜和裁剪的結果,使Tesseract的生活變得更容易...
所以完整的命令應該是下面的,它產生在我的系統上正確的結果:
convert 15071917.jpg \
-type grayscale \
-negate \
-gamma 1 \
-contrast -contrast -contrast -contrast -contrast -contrast -contrast -contrast -contrast -contrast \
-normalize -normalize -normalize -normalize -normalize -normalize -normalize -normalize -normalize -normalize \
-despeckle -despeckle -despeckle -despeckle -despeckle -despeckle -despeckle -despeckle -despeckle -despeckle \
-negate \
-deskew 40% \
+repage \
-crop 393x110+0+0 \
15071917.png \
&& \
tesseract 15071917.png OUT && cat OUT.txt
Tesseract Open Source OCR Engine v3.01 with Leptonica
Page 0
TESCO
這是原始圖像(左)與所得到的修改命令的圖片(右):
該命令對我的作品的第一個圖像文件。我使用ImageMagick的版本6.7.9-0 2012-08-17 Q16
:
convert 1school.jpg \
-scale 1000% \
-blur 1x65535 -blur 1x65535 -blur 1x65535 \
-contrast \
-normalize \
-despeckle \
-despeckle \
-type grayscale \
-sharpen 1 \
-posterize 3 \
-negate 1school.tif \
&& \
tesseract 1school.tif OUT && cat OUT.txt
Tesseract Open Source OCR Engine v3.01 with Leptonica
Page 0
'
SCHOOL
ZONE
第2圖像需要不同的命令:
convert 15071917.jpg \
-type grayscale \
-negate \
-gamma 1 \
-contrast -contrast -contrast -contrast -contrast -contrast -contrast -contrast -contrast -contrast \
-normalize -normalize -normalize -normalize -normalize -normalize -normalize -normalize -normalize -normalize \
-despeckle -despeckle -despeckle -despeckle -despeckle -despeckle -despeckle -despeckle -despeckle -despeckle \
15071917.tif \
&& \
tesseract 1school.tif OUT && cat OUT.txt
Tesseract Open Source OCR Engine v3.01 with Leptonica
Page 0
TE§§IO
好了,第二個是不太成功的。但你明白了......
這裏是最終的圖像。左邊是原件,從命令正確的結果:
感謝您的回覆。我試過了,它工作。我會嘗試其他可能的方式爲圖像2 – curious 2012-08-18 15:00:11
今天我學到了一些新東西。憑藉Tesseract 3.01,看起來最簡單的方法就是讓OCR工作成爲首先deskew的文字。
這是一個非常簡單的命令,剛剛剪的形象和作物有點,但不會做任何對比度或顏色改變操作原文:
convert 15071917.jpg \
-background pink \
-shear -0x6 \
-crop 350x80+0+24 \
tesco.jpg \
&& \
tesseract tesco.jpg a && cat a.txt
Tesseract Open Source OCR Engine v3.01 with Leptonica
TESCO
它工作得很好!非常感謝你的答覆,也許我可以在其他類似的圖片上嘗試相同的想法。 – curious 2012-08-19 07:05:14