我想知道是否有任何技術/ API可用於執行快速屏幕字體OCR?快速屏幕字體OCR技術或API?
以下是理所當然的:
- 文本OCR應來自截圖,並應使用屏幕字體
- 文本OCR可能會或可能不會是反鋸齒渲染
- 抗鋸齒可能或不使用RGB抽取(又名子像素AA又名的ClearType等)
- 截圖可以是RGB或RBG爲了
- 基線是微不足道找到(看看所有顯示屏F onts:基線顯得非常清晰,並且很容易在算法上找到)
- 允許很多錯誤(字符識別不需要100%正確)
- 字體基本上是預先知道的,字體呈現不是(尺寸未知,顏色未知,抗鋸齒類型未知)。基本上什麼是已知的是,這將是非常常見的字體
所以我想這是沒有任何接近複雜,因爲這樣做「真正的」 OCR:找到基線和「切割」每個字符是很容易做到(我已經做到了)。
有沒有人知道特定的技術或紙張或甚至API允許做這樣的壯舉?
請注意:這個問題是關於屏幕抓取的而不是。這個問題是關於破解CAPTCHA的而不是。這個問題是關於正規OCR的而不是(如OCRing掃描的文本)。這個問題是關於GUI自動化的而不是(儘管有些人可能會這樣使用它)。
**標記建議**如果此問題與GUI自動化有關,請添加gui-automation標記。如果這是您計劃開發自己的OCR算法技術,請添加算法標籤。如果您正在尋找爲此目的而設計的開源OCR實現,請添加開源標籤。 – rwong
請參閱此問題的任何答案http://stackoverflow.com/q/896224/377657是否適用於您的情況。 – rwong
你有什麼進展嗎?我正在嘗試做同樣的事情,我注意到在屏幕字體中字符完全相同,這是一個有用的功能。即「a」在屏幕上的不同位置看起來與「a」相同。 – Phil