2010-04-15 64 views
4

我有一個音頻緩衝區,我想對它執行語音識別/轉錄。我在本地限制了CPU和RAM,所以我想在服務器上執行識別。語音識別(網絡)服務?

有沒有任何(網絡)服務,讓我這樣做?

我搜索迄今已導致無處...

+0

我發現Spinvox創建,太... – 2010-04-22 18:54:42

回答

1

Lumenvox提供這樣的服務,但似乎對你的需要昂貴。

+0

這是一個很好的發現,雖然他們的程序員文檔是不存在的。看起來它是「先買,後再理解」。我還發現了Spinvox Create,它的文檔是可用的 - 但它是一堆可怕的Web API cruft,需要自定義標題,摘要式身份驗證,包含XML和64編碼音頻的多部分帖子,其格式不會過分但不容易轉換爲從我的設備... – 2010-04-22 18:56:23

2

谷歌剛剛通過HTML5引入了對其語音引擎的基於瀏覽器的訪問。

http://slides.html5rocks.com/#speech-input

爲了得到這個頁面的工作,我推出了Chromium瀏覽器中的Ubuntu如下:

$ chromium-browser --enable-speech-input 

我認爲這個想法是能夠構建使用谷歌的語音識別應用,但我沒有機會深入研究它。

另一個有趣的項目是從WAMI MIT: http://wami.csail.mit.edu

+2

而且...自從Chromium是OSS,我只是花了一些時間,發現是的,的確,有一個RESTful服務端點,它談到。建立一個單獨的庫以調用識別應該不會太難...... – 2011-02-13 04:18:29

+0

戴夫,你有沒有在這方面進一步工作? – 2012-05-15 12:32:05

+0

雖然在Chromium中執行Python/Ruby/etc中的API應該相當簡單...假設您可以爲您選擇的語言找到Speex編解碼器API。 – 2012-06-06 04:09:19