這一個問題,從OS X Yosemite (10.10) API for continuous speech recognition從OS X的語音識別工具
OSX截獲輸入現擁有精湛的連續語音識別。但它似乎沒有公開任何API。我正在構建定製的HCI套件,並且我需要捕獲此語音輸入以便處理它。
如何截取它?
我的第一個想法是,它可能會創建一些虛擬鍵盤設備,通過它發送按鍵/按鍵事件。如果是這種情況,我可以使用IOKit攔截,但枚舉我的鍵盤設備它不會出現。所以它必須是更高層次的東西。
請注意我添加了'黑客'標籤,因爲看起來沒有現成的路徑 - 這顯然是蘋果無意提供的。
編輯:
How to use DictationServices.framework
Can I use OS X 10.8's speech recognition/dictation without a GUI?
什麼是你想截取,確切?音頻輸入?文本輸出?如果是後者,你不能從文本小部件中讀取它嗎? – rhashimoto