谷歌語音識別庫或API

谷歌最近用他們的語音識別軟件取得了很大的進展，該軟件用於幾種開源產品，例如， Chromium Web Speech和Android免提短信。我想使用他們的語音識別作爲我的服務器堆棧的一部分，但我找不到太多。谷歌語音識別庫或API

文本識別軟件是否可用作庫或包？或者，我可以從另一個程序調用鉻來將某些音頻文件轉錄爲文本嗎？

2013-03-22 Jeroen

查看類似的問題http://stackoverflow.com/questions/12489321/using-google-api-speech-to-text-on-pc-version和http://stackoverflow.com/questions/7879804/does-任何人使用google-speech-api-in-production – 2013-03-24 20:31:53

我認爲這些答案可能已經過時，Google已經開始在2013年初公開某些部分。 – Jeroen 2013-03-25 19:55:08

獲得了鏈接？這將有所幫助。 – 2013-03-25 22:08:04

Web Speech API的設計僅適用於Chrome或Android環境。在客戶端中有很多工作要做，所以沒有公共的服務器API來接收音頻文件並處理它。

如果您搜索github，您會發現諸如https://gist.github.com/alotaiba/1730160之類的工具，但我相當肯定此訪問方法100％不受支持，認可或確認可以繼續工作。

來源

2013-05-29 15:17:03 Kinlan

以前在https://gist.github.com/alotaiba/1730160上陳述的方法確實對我有用。我在家庭自動化計劃中每天都會使用它。我使用python腳本來捕捉音頻並確定什麼是有用的音頻或噪聲，然後將小音頻片段發送到谷歌，並在一秒鐘內返回文本！我已經成功地將它集成到我的程序中，如果你在谷歌周圍，你會發現更多的人也有！

來源

2013-06-23 04:11:37

谷歌語音識別庫或API

回答

相關問題