沃森語音到文本響應時間

有一些麻煩與服務，同時推動以Bluemix沃森語音到文本響應時間

推送請求我通過PHP捲曲發送是：

POST https://stream.watsonplatform.net/speech-to-text/api/v1/recognize

與以下參數

型號：en-US_NarrowbandModel
內容類型：audio/wav;速度：8000
傳輸編碼：分塊
時間戳：真
word_confidence：真
連續：真

響應超時設置爲H（7200000毫秒）

我們正在從越來越超時捲起我們的一些文件，沒有任何明顯的原因，起初我以爲是與錄音的持續時間有關，但我有日誌成功請求音頻文件〜200秒長，超時錄製129秒。

我認爲這可能是一個超時問題或音頻文件上傳中的一些錯誤，所以我開始研究會話，但我不清楚如何會話過程的工作原理，我不能在文檔中進行整理。

下列文件（https://www.ibm.com/smarterplanet/us/en/ibmwatson/developercloud/speech-to-text/api/v1/）

，我會很高興，如果我能得到一些反饋/什麼我做錯了建議......

謝謝...

來源

2015-09-03 Denham Williams

你被USI做錯了ng IBM服務;）您可能會考慮開源引擎，比如採用Fisher聲學模型的Kaldi，它應該提供非常有競爭力的準確性，並且您可以通過可預測的週轉時間在本地運行它。 –

如果文件您提交的內容很長，那麼即使您使用會話，REST界面也可能會導致超時。一般來說，我建議您嘗試使用Watson Speech To Text服務的WebSockets接口。這個接口也比帶會話的REST接口簡單得多，並且你不應該遇到超時問題。如果你的文件包含很長時間的沉默，請不要忘記將inactivity_timeout參數設置爲一個較高的值，例如600

的文檔是在這裏：

https://www.ibm.com/smarterplanet/us/en/ibmwatson/developercloud/doc/speech-to-text/websockets.shtml

一個簡單的python中工作的例子是在這裏：

https://github.com/watson-developer-cloud/speech-to-text-websockets-python

達尼

來源

2015-09-14 14:13:27

您可以在答案中包含文檔和代碼的相關部分嗎？ –

沃森語音到文本響應時間

回答

相關問題