有一些麻煩與服務,同時推動以Bluemix沃森語音到文本響應時間
推送請求我通過PHP捲曲發送是:
POST https://stream.watsonplatform.net/speech-to-text/api/v1/recognize
與以下參數
型號:en-US_NarrowbandModel
內容類型:audio/wav;速度:8000
傳輸編碼:分塊
時間戳:真
word_confidence:真
連續:真
響應超時設置爲H(7200000毫秒)
我們正在從越來越超時捲起我們的一些文件,沒有任何明顯的原因,起初我以爲是與錄音的持續時間有關,但我有日誌成功請求音頻文件〜200秒長,超時錄製129秒。
我認爲這可能是一個超時問題或音頻文件上傳中的一些錯誤,所以我開始研究會話,但我不清楚如何會話過程的工作原理,我不能在文檔中進行整理。
下列文件(https://www.ibm.com/smarterplanet/us/en/ibmwatson/developercloud/speech-to-text/api/v1/)
,我會很高興,如果我能得到一些反饋/什麼我做錯了建議......
謝謝...
你被USI做錯了ng IBM服務;)您可能會考慮開源引擎,比如採用Fisher聲學模型的Kaldi,它應該提供非常有競爭力的準確性,並且您可以通過可預測的週轉時間在本地運行它。 –