2017-06-14 168 views

回答

0

Nexmos語音核心運行速度爲16bit/16kHz,但我們僅限於電話公司向我們提供的任何音頻,通常爲8Khz G.711編解碼器。

我們做了上樣,但正如您發現對於語音識別API並不總是奏效。 我還沒有測試過Google API,但它非常接近我的待辦事項列表的頂部。 同時,您可能需要查看IBM Watson API,因爲它們具有窄帶語音模型,這似乎在電話方面效果更好。這裏有一些示例代碼https://github.com/nexmo-community/voice-watson-speechtotext