2015-09-03 35 views
2

有一些麻煩與服務,同時推動以Bluemix沃森語音到文本響應時間

推送請求我通過PHP捲曲發送是:

POST https://stream.watsonplatform.net/speech-to-text/api/v1/recognize

與以下參數

型號:en-US_NarrowbandModel
內容類型:audio/wav;速度:8000
傳輸編碼:分塊
時間戳:真
word_confidence:真
連續:真

響應超時設置爲H(7200000毫秒)

我們正在從越來越超時捲起我們的一些文件,沒有任何明顯的原因,起初我以爲是與錄音的持續時間有關,但我有日誌成功請求音頻文件〜200秒長,超時錄製129秒。

我認爲這可能是一個超時問題或音頻文件上傳中的一些錯誤,所以我開始研究會話,但我不清楚如何會話過程的工作原理,我不能在文檔中進行整理。

下列文件(https://www.ibm.com/smarterplanet/us/en/ibmwatson/developercloud/speech-to-text/api/v1/

,我會很高興,如果我能得到一些反饋/什麼我做錯了建議......

謝謝...

+0

你被USI做錯了ng IBM服務;)您可能會考慮開源引擎,比如採用Fisher聲學模型的Kaldi,它應該提供非常有競爭力的準確性,並且您可以通過可預測的週轉時間在本地運行它。 –

回答

5

如果文件您提交的內容很長,那麼即使您使用會話,REST界面也可能會導致超時。一般來說,我建議您嘗試使用Watson Speech To Text服務的WebSockets接口。這個接口也比帶會話的REST接口簡單得多,並且你不應該遇到超時問題。如果你的文件包含很長時間的沉默,請不要忘記將inactivity_timeout參數設置爲一個較高的值,例如600

的文檔是在這裏:

https://www.ibm.com/smarterplanet/us/en/ibmwatson/developercloud/doc/speech-to-text/websockets.shtml

一個簡單的python中工作的例子是在這裏:

https://github.com/watson-developer-cloud/speech-to-text-websockets-python

達尼

+1

您可以在答案中包含文檔和代碼的相關部分嗎? –

相關問題