2012-10-04 176 views
25

我現在正在與我的項目合作,我即將爲桌面計算機構建一個類似Siri的應用程序。我在考慮Google語音API是否可靠且準確地進行語音識別?你能告訴我什麼語音API在語音識別方面最準確嗎?最優選的是免費的API。謝謝。谷歌語音API

+0

您可能需要考慮運行您自己的語音識別器。 CMU Sphinx提供了特定的聲學模型併爲在移動設備中使用構建了說明http://cmusphinx.sourceforge.net/wiki/building –

回答

36

雖然Google語音API是免費的,但它不是官方的公共API。有些人已經對其進行了逆向設計,如discussed in this blog。如果您打算直接訪問API以獲得商業產品,我不會推薦它,因爲他們可以放棄它或在沒有警告的情況下進行更改,從而打破您的產品。最近發生在使用Google Weather API的開發者身上。如果您通過Chrome瀏覽器使用x-webkit-speech訪問它,則可能是安全的,因爲它受Google支持。谷歌的語音識別功能與許多更受歡迎的商業解決方案一致。他們在Google Voice等其他項目以及現已停用的Google 411中擁有豐富的經驗。他們有一些頂尖的語音科學家爲他們工作。我唯一能想到的另一個免費替代方案是Sphinx這是一個卡內基梅隆大學開源項目。使用這種解決方案的學習曲線陡峭,如果您希望將其設置爲服務,您將不得不自己開發。 Nuance是語音識別市場的另一個重要參與者(我相信這是Siri使用的),他們確實有提供語音識別服務的解決方案。但它們很昂貴。在回答評論

更新的語言支持

Windows語音識別支持其他語言一樣,大多數語音識別系統。但是要注意的是,你必須告訴系統使用什麼語言,並且必須支持有問題的語言。每個供應商都有一個它支持的語言列表,它們是特定於某個地區的。例如,供應商可能支持墨西哥西班牙語,美國西班牙語和西班牙西班牙語;所有的方言都略有不同。但語音識別引擎只能在每個用戶的計時器上支持一種語言/方言。用戶不能先向語音識別系統講多種語言,而不先請求它改變爲該語言。

更新2014年3月17日

的x WebKit的語音輸入字段已被棄用,由於缺乏在其他瀏覽器的支持。這將被替換爲Web Speech API,這是一個javascript API。你可以找到一個example on how to use it here

+0

我與Google在Google API上完全達成了協議。由於該問題是針對桌面應用的,因此我只需添加一條建議。 Windows爲其桌面和服務器操作系統提供免費的語音識別功能。有關更多信息,請參閱http://stackoverflow.com/questions/4213035/sapi-and-windows-7-problem和http://stackoverflow.com/a/6351055/90236。 –

+0

我在Windows語音識別的準確性方面遇到了麻煩,也許是因爲它需要用英語說話。我也想知道哪些API在語音識別方面最準確,並且還會採用其他語言。感謝您邁克爾•勒維和凱文•瓊漢斯。 –

+1

非常感謝您的迴應,先生。我現在將這個Google語音API用於我的項目。關於它的準確性好,但也許我可以在下次改變它,如果一些語音API的提供更多的準確性比這取決於我將使用它的項目。謝謝你.. –