你好,我正在開發使用C#的Visual Studio 2017年的應用程序,我測試的語音編碼文本和它的工作,但現在我需要做的揚聲器diarization 我怎麼能這樣做? SpeechToTextService _speechToText = new SpeechToTextService();
_speechToText.SetCredential("", "");
//var result
我在使用IBM語音轉文本服務獲取轉錄以在我的android應用程序上工作而苦苦掙扎。以下是記錄文件和轉錄文件的代碼。 示例代碼我把沃森從github link 媒體記錄輸出 mediaRecorder = new MediaRecorder();
mediaRecorder.setMaxDuration(MAX_DURATION);
mediaRecorder.setAudioSource(M
從例子https://github.com/timediv/speechT,我試圖適應與LSTM網絡一起使用,但失敗請幫忙。我嘗試了許多組合,但我總是有錯誤,即輸入必須是序列或其他。爲了語音識別的目的,我需要實現LSTM網絡,並且在嘗試了幾個星期後,我仍然陷入了編碼問題。任何人都可以幫助我提供使用LSTM網絡的例子,樣本會很好。 class InputBatchLoader(BaseInputLo
我正在開發一個機器人,它將接收語音(從Facebook頻道),並將其轉換爲.wav。 我使用的示例:How can a bot receive a voice file from Facebook Messenger (MP4) and convert it to a format that is recognized by speech engines like Bing or Google?