2016-08-03 83 views
3

我正在使用Microsoft語音識別 - REST API將音頻文件轉換爲文本。我能夠從演講中獲得文本,但只能獲得文本的一部分。Microsoft語音REST API是否具有音頻長度限制

如果我使用長度大於50秒的音頻文件。它僅返回文本結果的前50秒,50秒後的任何內容都將被忽略。有沒有音頻長度的限制,或者我錯過了什麼?

代碼示例:https://oxfordportal.blob.core.windows.net/speech/doc/recognition/Program.cs

你的幫助是高度讚賞。 非常感謝。

Bishwa

+0

您可能想嘗試IBM的STT服務,您可以在單個請求中推送幾小時的音頻數據...演示:https://speech-to-text-demo.mybluemix.net/ –

回答

0

文檔here說:

您的應用程序必須端點的音頻,以確定啓動並講話,而這又是使用由服務端來確定的開始和結束請求。您在任何一個請求中都不得上傳超過10秒的音頻,並且總請求持續時間不能超過14秒。

所以,這表明你很幸運會得到50秒。
相反,您應該將音頻切割成更小的塊併發出多個請求。

+0

嗨Buh Buh , 感謝您的回覆。我已將HttpWebRequest的SendChuncked屬性設置爲true。我以較小的塊發送音頻(例如,示例代碼中的1024字節)。 – Bishwa