Nexmo音頻採樣率

-1

我們已將Nexmo語音WebSocket API（電話）與Google Voice Recognition API相連，但質量很差。我們假設原因是採樣率。 Google需要16KHZ，但不能上採樣。 Nexmo是否支持這個？查看我們的示例https://www.youtube.com/watch?v=cIxS_CF3t00 Nexmo音頻採樣率

來源

2017-06-14 Vangelis Kanellopoulos

Nexmos語音核心運行速度爲16bit/16kHz，但我們僅限於電話公司向我們提供的任何音頻，通常爲8Khz G.711編解碼器。

我們做了上樣，但正如您發現對於語音識別API並不總是奏效。我還沒有測試過Google API，但它非常接近我的待辦事項列表的頂部。同時，您可能需要查看IBM Watson API，因爲它們具有窄帶語音模型，這似乎在電話方面效果更好。這裏有一些示例代碼https://github.com/nexmo-community/voice-watson-speechtotext

來源

2017-06-14 13:20:29

Nexmo音頻採樣率

回答

相關問題