2009-05-22 56 views
4

我試圖通過捕獲屏幕截圖來創建一個自動化PC的軟件,然後OCR(光學字符識別)它尋找一個特定的按鈕來點擊(用於例)。我有鼠標和鍵盤控制部分,但現在,我需要一個OCR來處理屏幕截圖。我發現的是,Tesseract OCR似乎不能很好地處理屏幕上的文字。文字要麼太小,要麼文字似乎是連接的,比如K和X.我應該怎麼做呢?用於屏幕文本的OCR(光學字符識別)

p/s:這是一個自動化測試程序。

+0

你能否碰到文本大小並調整測試機器上的字體? – 2009-05-22 03:23:08

回答

0

也許看看this question在OCR之前的圖像增強。 否則這個問題非常類似於"OCR for .NET"

如果你感覺真的很大膽你總能掀起:-)

0

一個簡單的基於感知或神經網絡的方法,我不知道這是否真的適合你的法案,但一些比較好的OCR的那我已經看到自動化是由Tevron的CitraTest完成的。它有一個包含字體的庫,如果字體集不存在,他們將根據您的提交內容創建一個新的字體集。這種工具的影響因素是成本以及與可變屏幕分辨率相關的常見問題。