將音頻轉換爲文本
回答
你可能會檢查Microsoft Speech API。我認爲他們提供了一個可以用於您的目標的SDK。
對於Java,似乎還有來自Sun的解決方案:javax.speech.recognition
您可以使用SoX(聲音處理程序的瑞士軍刀)將音頻文件轉換爲具有對應於聲音頻率/音量的數值的文本文件。
我已經完成了以前的項目,但不知道確切的命令選項。
下面是該項目的鏈接:http://sox.sourceforge.net/Main/HomePage
下面是使用C#和System.Speech一個完整的例子
的代碼可以被分成2個主要部分:
配置SpeechRecognitionEngine對象(及其必需的元素) 處理SpeechRecognized和SpeechHypothesized事件。
步驟1:配置SpeechRecognitionEngine
_speechRecognitionEngine = new SpeechRecognitionEngine();
_speechRecognitionEngine.SetInputToDefaultAudioDevice();
_dictationGrammar = new DictationGrammar();
_speechRecognitionEngine.LoadGrammar(_dictationGrammar);
_speechRecognitionEngine.RecognizeAsync(RecognizeMode.Multiple);
在這一點上你的對象是準備開始從麥克風錄製音頻。您需要處理一些事件,以便實際訪問結果。
步驟2:處理所述SpeechRecognitionEngine活動
_speechRecognitionEngine.SpeechRecognized - =新的EventHandler(SpeechRecognized); _speechRecognitionEngine.SpeechHypothesized - = new EventHandler(SpeechHypothesizing);
_speechRecognitionEngine.SpeechRecognized + = new EventHandler(SpeechRecognized); _speechRecognitionEngine.SpeechHypothesized + = new EventHandler(SpeechHypothesizing);
私人無效SpeechHypothesizing(對象發件人, SpeechHypothesizedEventArgs E){ ///實時結果從發動機 串realTimeResults = e.Result。文本; }
私人無效SpeechRecognized(對象發件人,SpeechRecognizedEventArgs e)從發動機串finalAnswer = e.Result.Text { ///最終答案; }
就是這樣。如果你想使用一個預先錄製的.wav文件,而不是一個麥克風,你可以使用
_speechRecognitionEngine.SetInputToWaveFile(pathToTargetWavFile);
代替
_speechRecognitionEngine.SetInputToDefaultAudioDevice();
在這些類中有一堆不同的選項,它們值得探索更多細節。
- 1. 如何將音頻轉換爲文本?
- 2. 將音頻轉換爲文本
- 3. 將二進制音頻文本轉換爲音頻文件
- 4. 音頻轉換爲文本編程
- 5. 將WMA音頻文件轉換爲MP3音頻文件
- 6. 用於將語音/音頻數據轉換爲文本的API
- 7. 將視頻或音頻轉換爲文本而不播放它?
- 8. 將chrome.tabcapture.capture轉換爲音頻文件?
- 9. 將音頻文件轉換爲base64
- 10. 將音頻文件轉換爲mp3
- 11. 將spx音頻文件轉換爲mp3
- 12. 使用java將音頻文件轉換爲文本文件
- 13. 將wav音頻文件轉換爲DSS音頻格式
- 14. 將音頻和視頻轉換爲NSData
- 15. 如何將文本轉換爲iPhone中的音頻文件?
- 16. 如何將文本字段轉換爲音頻文件?
- 17. 使用SAPI將音頻(wav文件)轉換爲文本?
- 18. 在C#或Java中將音頻文件轉換爲文本
- 19. 使用SAPI將音頻輸入轉換爲文本
- 20. 將文本轉換爲音頻的工具
- 21. 如何將音頻文件.wav或語音識別轉換爲文本,Android Studio
- 22. 將語音轉換爲文本
- 23. 將語音轉換爲文本
- 24. 如何將語音轉換爲文本?
- 25. java中的音頻到文本轉換
- 26. 將頻率轉換爲鍵盤音符
- 27. 將原始音頻轉換爲mp3/ogg
- 28. 將音頻加倍轉換爲字節
- 29. 使用libsox將音頻轉換爲FLAC
- 30. 將音頻流轉換爲PCM
絕對不是內置的。我認爲您希望將您的問題擴展到可以從Java或C#使用的庫。 – Thilo 2010-10-18 10:46:23
感謝Thilo先生,好吧,如果你知道任何C#或Java的外部庫可以做我想做的事情,我將不勝感激,如果你告訴我,在此先感謝 – 2010-10-18 10:56:54
這可能有助於http://java.sun.com/ products/java-media/speech/reference/codesamples/index.html – 2010-10-18 11:02:18