語音識別（網絡）服務？

我有一個音頻緩衝區，我想對它執行語音識別/轉錄。我在本地限制了CPU和RAM，所以我想在服務器上執行識別。語音識別（網絡）服務？

有沒有任何（網絡）服務，讓我這樣做？

我搜索迄今已導致無處...

來源

2010-04-15 Dave Peck

我發現Spinvox創建，太... – 2010-04-22 18:54:42

Lumenvox提供這樣的服務，但似乎對你的需要昂貴。

來源

2010-04-18 21:50:09 clyfe

這是一個很好的發現，雖然他們的程序員文檔是不存在的。看起來它是「先買，後再理解」。我還發現了Spinvox Create，它的文檔是可用的 - 但它是一堆可怕的Web API cruft，需要自定義標題，摘要式身份驗證，包含XML和64編碼音頻的多部分帖子，其格式不會過分但不容易轉換爲從我的設備... – 2010-04-22 18:56:23

谷歌剛剛通過HTML5引入了對其語音引擎的基於瀏覽器的訪問。

http://slides.html5rocks.com/#speech-input

爲了得到這個頁面的工作，我推出了Chromium瀏覽器中的Ubuntu如下：

$ chromium-browser --enable-speech-input

我認爲這個想法是能夠構建使用谷歌的語音識別應用，但我沒有機會深入研究它。

另一個有趣的項目是從WAMI MIT： http://wami.csail.mit.edu

來源

2011-02-12 07:16:54 williampli

而且...自從Chromium是OSS，我只是花了一些時間，發現是的，的確，有一個RESTful服務端點，它談到。建立一個單獨的庫以調用識別應該不會太難...... – 2011-02-13 04:18:29

戴夫，你有沒有在這方面進一步工作？ – 2012-05-15 12:32:05

雖然在Chromium中執行Python/Ruby/etc中的API應該相當簡單...假設您可以爲您選擇的語言找到Speex編解碼器API。 – 2012-06-06 04:09:19

語音識別（網絡）服務？

回答

相關問題