0
我試圖將IBM語音轉換爲文本API以將信使中的音頻轉錄爲文本腳本。使用w4a格式的音頻將IBM語音轉換爲文本(Node.js)
request({
uri: attachment.url,
method: 'GET',
encoding: null
}, (err, res, audio) => {... do something...}
我使用請求從我在消息中得到的url中獲取音頻文件。 但我只能得到W4A文件,沃森只支持
音頻/ FLAC
音頻/ WAV
音頻/ L16
音頻/ OGG
怎麼辦我將w4a格式的音頻轉換爲wav以符合規格。
或者還有其他方法可以做到這一點嗎?
謝謝。
要查找的關鍵字是「nodejs」和「ffmpeg」。就像http://stackoverflow.com/questions/33725893/how-do-you-use-node-js-to-stream-an-mp4-file-with-ffmpeg –
這實際上是一個沃森問題,所以我們需要添加watson標籤以獲得正確的關注 –
這實際上是一個關於音頻轉換的問題,Watson STT服務支持的音頻格式在此處列出:https://www.ibm.com/watson/developercloud/doc/speech- to-text/input.html注意webm也被支持 –