我正在使用Microsoft語音識別 - REST API將音頻文件轉換爲文本。我能夠從演講中獲得文本,但只能獲得文本的一部分。Microsoft語音REST API是否具有音頻長度限制
如果我使用長度大於50秒的音頻文件。它僅返回文本結果的前50秒,50秒後的任何內容都將被忽略。有沒有音頻長度的限制,或者我錯過了什麼?
代碼示例:https://oxfordportal.blob.core.windows.net/speech/doc/recognition/Program.cs
你的幫助是高度讚賞。 非常感謝。
Bishwa
您可能想嘗試IBM的STT服務,您可以在單個請求中推送幾小時的音頻數據...演示:https://speech-to-text-demo.mybluemix.net/ –