我想在C#窗口應用程序中創建一個Windows應用程序,應用程序應使用IBM Watson服務執行語音到文本轉換。C# - 沃森 - 語音到文本API
我們應該如何實現IBM Watson Speech to Text API服務 https://stream.watsonplatform.net/speech-to-text/api應該聽用戶的聲音並編寫輸出文本。
我搜索了很多文章,在所有這些例子中,.wav(音頻)文件作爲輸入傳遞並輸出文本。
我試圖執行此語音更實時,而不是傳遞現有或存儲的音頻(.wav)文件。
使用Microsoft.Speech可以使用類似於 的代碼Recognizer.SetInputToDefaultAudioDevice()來完成相同的功能。這裏的缺點是,我們必須餵養DictationGrammer。這樣應用程序就可以識別語音並轉換爲文本。
是否有可能通過Watson API服務來完成類似的任務?