我現在正在與我的項目合作,我即將爲桌面計算機構建一個類似Siri的應用程序。我在考慮Google語音API是否可靠且準確地進行語音識別?你能告訴我什麼語音API在語音識別方面最準確嗎?最優選的是免費的API。謝謝。谷歌語音API
谷歌語音API
回答
雖然Google語音API是免費的,但它不是官方的公共API。有些人已經對其進行了逆向設計,如discussed in this blog。如果您打算直接訪問API以獲得商業產品,我不會推薦它,因爲他們可以放棄它或在沒有警告的情況下進行更改,從而打破您的產品。最近發生在使用Google Weather API的開發者身上。如果您通過Chrome瀏覽器使用x-webkit-speech訪問它,則可能是安全的,因爲它受Google支持。谷歌的語音識別功能與許多更受歡迎的商業解決方案一致。他們在Google Voice等其他項目以及現已停用的Google 411中擁有豐富的經驗。他們有一些頂尖的語音科學家爲他們工作。我唯一能想到的另一個免費替代方案是Sphinx這是一個卡內基梅隆大學開源項目。使用這種解決方案的學習曲線陡峭,如果您希望將其設置爲服務,您將不得不自己開發。 Nuance是語音識別市場的另一個重要參與者(我相信這是Siri使用的),他們確實有提供語音識別服務的解決方案。但它們很昂貴。在回答評論
更新的語言支持
Windows語音識別支持其他語言一樣,大多數語音識別系統。但是要注意的是,你必須告訴系統使用什麼語言,並且必須支持有問題的語言。每個供應商都有一個它支持的語言列表,它們是特定於某個地區的。例如,供應商可能支持墨西哥西班牙語,美國西班牙語和西班牙西班牙語;所有的方言都略有不同。但語音識別引擎只能在每個用戶的計時器上支持一種語言/方言。用戶不能先向語音識別系統講多種語言,而不先請求它改變爲該語言。
更新2014年3月17日
的x WebKit的語音輸入字段已被棄用,由於缺乏在其他瀏覽器的支持。這將被替換爲Web Speech API,這是一個javascript API。你可以找到一個example on how to use it here。
我與Google在Google API上完全達成了協議。由於該問題是針對桌面應用的,因此我只需添加一條建議。 Windows爲其桌面和服務器操作系統提供免費的語音識別功能。有關更多信息,請參閱http://stackoverflow.com/questions/4213035/sapi-and-windows-7-problem和http://stackoverflow.com/a/6351055/90236。 –
我在Windows語音識別的準確性方面遇到了麻煩,也許是因爲它需要用英語說話。我也想知道哪些API在語音識別方面最準確,並且還會採用其他語言。感謝您邁克爾•勒維和凱文•瓊漢斯。 –
非常感謝您的迴應,先生。我現在將這個Google語音API用於我的項目。關於它的準確性好,但也許我可以在下次改變它,如果一些語音API的提供更多的準確性比這取決於我將使用它的項目。謝謝你.. –
- 1. 谷歌語音API調用
- 2. 關於谷歌語音API
- 3. 谷歌語音API和網絡語音API的區別
- 4. Pocketsphinx VS谷歌的語音識別API
- 5. 谷歌語音識別庫或API
- 6. 網絡語音API在谷歌瀏覽
- 7. 谷歌語音識別api - 壞請求
- 8. 解析SMSThread谷歌語音的Java API
- 9. 未能執行谷歌雲語音API
- 10. 谷歌文本到語音API
- 11. 谷歌語音API無效識別
- 12. 谷歌雲語音API:通過REST
- 13. 谷歌語音api空的結果JSON
- 14. 如何使用谷歌雲語音API
- 15. 谷歌語音API仍然支持?
- 16. 谷歌的語音識別API
- 17. 谷歌雲語音API增加語音上下文
- 18. 谷歌語音API中口語的語言代碼檢測
- 19. 谷歌雲語音API:Nodejs
- 20. 谷歌語音從通知
- 21. 谷歌語音PHP OAuth 2.0
- 22. 谷歌語音API拋出無效音頻通道數
- 23. 谷歌語音API - 識別base64編碼音頻
- 24. 谷歌語音識別API幾秒鐘後停止錄音
- 25. Phonegap android和iPhone - 谷歌地圖api v3與導航語音api
- 26. 谷歌Oauth2與谷歌語音API服務帳戶rpc不起作用
- 27. 谷歌雲API語法
- 28. 使用谷歌語音到文本API時出現400錯誤
- 29. 如何增加谷歌語音API查詢請求超過50
- 30. PHP - 谷歌語音API:未找到'Google \ Cloud \ Speech \ SpeechClient'類
您可能需要考慮運行您自己的語音識別器。 CMU Sphinx提供了特定的聲學模型併爲在移動設備中使用構建了說明http://cmusphinx.sourceforge.net/wiki/building –