在屏幕截圖中檢測文本的區域

我正在開發一個項目來增加Wine自動測試軟件包的能力。我現在要做的是在當前窗口的屏幕截圖中檢測文本。然後我可以解析所有的文本，並使用autohotkey來點擊我想要的文本的座標。在屏幕截圖中檢測文本的區域

例如，在firefox中，我可能想測試不同的東西，首先打開正在打開的偏好設置。然後我需要解析firefox的截圖，檢測文本的所有單獨位置。然後，我可以將這些單獨的文本圖像運行到tesseract-ocr中，並檢測哪一個圖像顯示爲「編輯」。然後我再次重做這個「偏好」。

我試圖找到一個解決方案，但到目前爲止找不到任何東西。我更喜歡使用python或python綁定的解決方案，因爲我一直在編程。

2011-03-23 Shelnutt2

沒有您需要某種沿途光學字符識別解決方案，以正確地解析文本？換句話說，你將如何從圖像中獲取文本？ – reckoner 2011-03-31 15:56:23

可能的起點是Project SIKULI。它是一種自動化GUI測試的工具。它是用Java編寫的，但它包含一個基於Jython的腳本編寫環境，因此修改它以支持python腳本可能不會太困難。

2011-03-23 13:38:05

2011-11-14 15:49:31 woto

回答