我有一個工作應用程序,它使用Bluemix Speech to Text API爲Http Live流媒體源提供隱藏字幕。但是,從ts文件解析聲音有一些延遲。我的代碼如下:bluemix實時語音與HLS文本
videoProps.stream = WatsonSpeechToText.recognizeElement({
element: myMediaElement,
token: videoProps.ctx.token,
muteSource: false,
autoPlay: false,
model:videoProps.ctx.currentModel,
timestamps: true,
profanity_filter: true,
inactivity_timeout: -1,
continuous: true
})
.pipe(new WatsonSpeechToText.FormatStream());
videoProps.stream.on("result", function(result) {
//do something
}
是否有一個更快的API使用,使我更接近實時?
感謝
您好亞倫看到這些模型和它們的特徵的文檔中的更多信息, 哪種模式是您使用?英語寬帶模式?速度很大程度上取決於錄製的質量。什麼是你得到的實時因素(RTF =解碼時間/音頻時間)。哪種音頻格式?請嘗試通過我們的演示來提供您的文件。當我對它說話時,我總是比實時識別更快。 Dani –