問題的要點是IBM Watson Speech to Text僅允許上傳FLAC,WAV和OGG文件格式並與API一起使用。IBM Watson語音到文本在Node.js Web應用程序上進行音頻轉換
我的解決方案是,如果用戶上傳mp3,在將文件發送到Watson之前,將發生數據轉換。基本上,用戶上傳一個mp3,然後使用ffmpeg或sox將音頻轉換爲OGG,然後將音頻上傳到Watson。
我不確定的是:爲了允許音頻轉換髮生,我必須在Node.js Watson代碼中修改什麼?下面鏈接是沃森回購這是我正在努力通過。我相信這個文件必須被修改,我已經鏈接了fileupload.js,但是修改的地方是我不確定的。
我已經瀏覽了SO和developerWorks,IBM SO來解答這個問題,但是我還沒有看到任何這是我在這裏發佈的原因。如果有必要,我會很樂意澄清我的問題。
跟進質詢,這一點,我目前使用的ffmpeg的文件轉換。但是這個音頻轉換庫將整個音頻文件加載到內存中,而不是以塊的形式進行。什麼是這個問題的一個好的解決方案? – YAL