如何在服務器端實現語音識別(請不要暗示HTML5's x-webkit-speech
,javascript等)?該程序將以音頻文件作爲輸入並以足夠的準確度提供音頻文件的文本轉錄。我可以使用哪些選項?如何設置語音識別服務器?
我嘗試過實施Sphin4 with Voxforge model,但準確性很差(它們可能在我的配置中也存在一些問題,我仍試圖學習它)。在一個帖子我看了,當我們使用<input name="speech" id="speech" type="text" x-webkit-speech />
輸入發送到外部服務器和服務器並不比識別,並將數據發送回瀏覽器。
我怎樣才能設置該服務器?任何現有的開放源代碼服務器如果能以最小的錯誤率識別英文句子,它也會很有用。
我正在開發的應用程序將被安裝在服務器和'解碼文本'將是這個模塊的輸出,將被應用程序的其他模塊使用...我曾嘗試配置Sphinx4與VoxForge和集線器...但到目前爲止沒有工作看到的問題http://stackoverflow.com/questions/8727389/dictation-application-using-sphinx4,please help ... – aProgrammer 2012-01-18 14:18:55