我試圖從屏幕快照中檢測到幾個大寫字符。我將其轉換爲黑色和白色PIL,然後使用從PyTesser頁的代碼示例中,我在圖像上運行tesser.exe:pytesser的成功率很低?這是一個噪音問題,還是還有其他需要完成的事情?
from pytesser import *
image = Image.open('fnord.tif')
print image_to_string(image)
我使用這個圖片:
但它不承認它是一個E,或者對於這個問題真的是任何東西。我認爲它是一個足夠乾淨的捕獲?頂部的噪音並沒有把它扔掉,對吧?
有什麼我失蹤了嗎?
我運行命令行util顯示'Tesseract開放源碼OCR引擎v3.02與Leptonica' - 沒有'psm'選項 - 我得到一個空文件。使用'-psm 10'這被認爲是「把圖像當作一個單獨的字符」 - 我得到'%'後跟兩條換行符...... – 2012-08-12 18:00:21
[限制字符tesseract尋找](http://stackoverflow.com/questions/2363490/limit-characters-tesseract-is-looking-for)在過去幫助過我。 – user500198 2012-09-01 18:15:35
如果您試圖識別的大寫字符是在問題中顯示的明確的唯一字體類型中,那麼沒有太多理由依賴於tesseract。一些簡單的拓撲特徵和骨架信息可以直接解決這個問題。 – mmgp 2013-02-10 05:36:43