回答
我建議你使用WAV格式,在案件:流行的格式。取決於使用情況。
如果您確實需要使用MP3
,您可以簡單地將convert MP3轉換爲WAV。
但是,格式語音到文本的支持是:
音頻/ FLAC:無損音頻編解碼器(FLAC),一個無損壓縮音頻編碼格式。有關更多信息,請參閱en.wikipedia.org/wiki/FLAC。
音頻/ L16:線性的16位脈衝編碼調製(PCM ),一種非壓縮音頻數據的格式。使用此媒體類型傳遞原始PCM文件。請注意,線性PCM音頻也可駐留在容器波形音頻文件格式(WAV)文件中。欲瞭解更多信息,請參閱互聯網工程任務組(IETF)評論請求(RFC)2586和en.wikipedia.org/wiki/Pulse-code_modulation。
音頻/ WAV:波形音頻文件格式(WAV ),由微軟和IBM創建了一個標準。 WAV文件是一個容器,通常用於未壓縮的音頻比特流,但也可以包含壓縮音頻。有關更多信息,請參閱en.wikipedia.org/wiki/WAV。 該服務支持使用任何編碼的WAV文件。它接受最多9個頻道的音頻(由於FFmpeg的限制)。
audio/ogg/ audio/ogg; codecs = opus/audio/ogg; codecs = vorbis:Ogg是由Xiph.org基金會維護的免費開放容器格式;有關更多信息,請參閱www.xiph.org/ogg/。這兩種編解碼器都是免費的,開放的,有損音頻壓縮格式。 Opus是首選的編解碼器。如果您省略了編解碼器,該服務會自動從輸入音頻中檢測到它。
音頻/ WEBM/音頻/ WEBM;編解碼器= OPUS /音頻/ WEBM;編解碼器= Vorbis格式:網絡媒體(的WebM)是一個開放的媒體文件格式;有關更多信息,請參閱webmproject.org。 WebM支持使用Opus和Vorbis音頻編解碼器壓縮的音頻流; Opus是首選的編解碼器。如果您省略了編解碼器,該服務會自動從輸入音頻中檢測到它。對於展示如何在Chrome瀏覽器中從麥克風捕獲音頻並將其編碼爲WebM數據流的JavaScript代碼。
但是,隨着更多細節所有格式可以在語音到文本Official Documentation看到。 我建議您編輯更多的細節並閱讀文檔,通常IBM的文檔非常客觀和完整。
不要爲選擇特定的音頻格式進行語音到文本轉換而苦惱,大多數手動語音轉換爲文本或transcription services接受所有可用的格式。當我們對文本服務進行自動語音處理時,我總是更喜歡使用wav over mp3,因爲它包含高位音頻數據,而不會損失音頻的質量並被大多數語音引擎接受。以下是任何轉錄公司支持的格式列表:https://www.transcriptionwave.com/format.html
- 1. Speech to Text Android
- 2. Speech to text c#
- 3. AVSpeechSynthesizer Text-To-Speech
- 4. silverlight speech to text
- 5. Watson Speech to Text Latency
- 6. Android Java Speech to text
- 7. Speech to text result = null error
- 8. android text to speech toast message
- 9. text-to-speech C++ mac/windows
- 10. Speech To Text Recognizer not found
- 11. Text to Speech android not working
- 12. 有什麼方法可以修改Android Text To Speech發音?
- 13. 在Android Wear上運行Android Text to Speech?
- 14. Text To Speech在CountDownTimer中不工作
- 15. Android上的Speech To Text功能?
- 16. Speech to Text Conversion - NOt getting desired output
- 17. node webkit text to speech api not working?
- 18. Watson Speech-to-Text register_callback僅返回400秒
- 19. 408請求超時Microsoft Speech to Text
- 20. Google Speech To Text Api使用Objective C
- 21. 使用SAPI轉換Speech-to-Text
- 22. iOS - 轉換音頻格式(opus to mp3)
- 23. Microsoft Custom Speech Service逐個接受音頻文件和音頻
- 24. 音頻CMSampleBuffer格式
- 25. Rockbox音頻格式
- 26. Google Text to Speech和Samsung Tex to Speech引擎的最低支持android api級別是多少?
- 27. 我的CountDownTimer中的Text-To-Speech有什麼問題?
- 28. android text-to-speech問題在簡單測試中
- 29. Watson Speech to Text API支持Node.js的荷蘭語支持
- 30. 我在哪裏可以找到delphi的Text-to-Speech組件?
有沒有什麼你嘗試過,你正在努力(即:甚至手動不能幫助)?你問的一切應該已經在他們的網站上得到解答。 –