我只是計劃實現一些功能,如當鼠標懸停在Mac OS X平臺屏幕上的某些文本/字上時,「查找字典」。是否有可能知道在鼠標附近顯示哪些文本?
如何在屏幕上顯示鼠標附近的文本/文字,即使它們不在我自己的應用程序中。
什麼我可以做的是:
- 使用工作臺知道應用程序正在運行什麼。
- 使用可訪問性API來了解屏幕上的頂級UIElement。
- 如果應用程序使用類似於NSTextView(我通過檢查UIElement的「selected text」屬性來獲取它),使用可訪問性API來了解UIElement的選定字符串。
什麼我不能做的是:
- 如Safari一些應用程序,使用WebKit的框架,唯一的事情,我可以從輔助功能API得到的是「價值屬性」,這是當前內容HTML和一些名爲「AXTextMarker」的屬性。這些屬性不能在Google或任何文檔中找到。
- 有些應用程序甚至不支持Accessibility API,我能得到的僅僅是它的屏幕截圖。
有什麼方法可以調用系統API來識別圖像中的文本嗎?在雪豹中,有中文或日文輸入的手寫識別器功能,所以應該是一些OCR功能?我找不到任何開放的API。
手寫識別通常通過手勢(端點和暫停/角落)進行,而不是OCR。對典型人物的手寫進行OCR不會比從/ dev/random中捕獲更好。 ☺ – 2010-09-15 06:44:47
好的,原諒我的愚蠢,因爲我真的不知道該去哪裏。 – icespace 2010-09-15 07:26:31
然後另一個問題,我可以發送一些事件,甚至可以調用Quartz來重新渲染屏幕上某些區域的文本?也許我可以從中得到某些東西。 – icespace 2010-09-15 07:27:45