-1
我們已將Nexmo語音WebSocket API(電話)與Google Voice Recognition API相連,但質量很差。我們假設原因是採樣率。 Google需要16KHZ,但不能上採樣。 Nexmo是否支持這個? 查看我們的示例https://www.youtube.com/watch?v=cIxS_CF3t00Nexmo音頻採樣率
我們已將Nexmo語音WebSocket API(電話)與Google Voice Recognition API相連,但質量很差。我們假設原因是採樣率。 Google需要16KHZ,但不能上採樣。 Nexmo是否支持這個? 查看我們的示例https://www.youtube.com/watch?v=cIxS_CF3t00Nexmo音頻採樣率
Nexmos語音核心運行速度爲16bit/16kHz,但我們僅限於電話公司向我們提供的任何音頻,通常爲8Khz G.711編解碼器。
我們做了上樣,但正如您發現對於語音識別API並不總是奏效。 我還沒有測試過Google API,但它非常接近我的待辦事項列表的頂部。 同時,您可能需要查看IBM Watson API,因爲它們具有窄帶語音模型,這似乎在電話方面效果更好。這裏有一些示例代碼https://github.com/nexmo-community/voice-watson-speechtotext