2013-03-22 102 views
3

谷歌最近用他們的語音識別軟件取得了很大的進展,該軟件用於幾種開源產品,例如, Chromium Web Speech和Android免提短信。我想使用他們的語音識別作爲我的服務器堆棧的一部分,但我找不到太多。谷歌語音識別庫或API

文本識別軟件是否可用作庫或包?或者,我可以從另一個程序調用鉻來將某些音頻文件轉錄爲文本嗎?

+0

查看類似的問題http://stackoverflow.com/questions/12489321/using-google-api-speech-to-text-on-pc-version和http://stackoverflow.com/questions/7879804/does-任何人使用google-speech-api-in-production – 2013-03-24 20:31:53

+0

我認爲這些答案可能已經過時,Google已經開始在2013年初公開某些部分。 – Jeroen 2013-03-25 19:55:08

+0

獲得了鏈接?這將有所幫助。 – 2013-03-25 22:08:04

回答

1

Web Speech API的設計僅適用於Chrome或Android環境。在客戶端中有很多工作要做,所以沒有公共的服務器API來接收音頻文件並處理它。

如果您搜索github,您會發現諸如https://gist.github.com/alotaiba/1730160之類的工具,但我相當肯定此訪問方法100%不受支持,認可或確認可以繼續工作。

1

以前在https://gist.github.com/alotaiba/1730160上陳述的方法確實對我有用。我在家庭自動化計劃中每天都會使用它。我使用python腳本來捕捉音頻並確定什麼是有用的音頻或噪聲,然後將小音頻片段發送到谷歌,並在一秒鐘內返回文本!我已經成功地將它集成到我的程序中,如果你在谷歌周圍,你會發現更多的人也有!