C＃ - 沃森 - 語音到文本API

-1

我想在C＃窗口應用程序中創建一個Windows應用程序，應用程序應使用IBM Watson服務執行語音到文本轉換。C＃ - 沃森 - 語音到文本API

我們應該如何實現IBM Watson Speech to Text API服務 https://stream.watsonplatform.net/speech-to-text/api應該聽用戶的聲音並編寫輸出文本。

我搜索了很多文章，在所有這些例子中，.wav（音頻）文件作爲輸入傳遞並輸出文本。

我試圖執行此語音更實時，而不是傳遞現有或存儲的音頻（.wav）文件。

使用Microsoft.Speech可以使用類似於的代碼Recognizer.SetInputToDefaultAudioDevice（）來完成相同的功能。這裏的缺點是，我們必須餵養DictationGrammer。這樣應用程序就可以識別語音並轉換爲文本。

是否有可能通過Watson API服務來完成類似的任務？

IBM的沃森SDK用於.NET對WebSockets的支持，將滿足更多轉錄實時上傳與音頻文件的您的要求：

的WebSockets包括建立與持久連接單個呼叫服務通過WebSocket協議。

該SDK可以找到here和SDK中的Speech to Text的具體細節可以找到here。

2017-06-19 16:33:15 tmarkiewicz

回答