從mp3生成音量曲線

我想在python中構建一些可以分析上傳的mp3並生成必要的數據來構建波形圖形的東西。我發現的一切都比我需要的複雜得多。最終，我正在嘗試構建像你在SoundCloud上看到的東西。從mp3生成音量曲線

我一直在尋找numpy和fft's，但這一切似乎比我需要更復雜。最好的辦法是什麼？我將使用畫布構建實際的圖形，所以不要擔心它的那一部分，我只需要繪製數據。

2012-02-13 Scott

'fft'是針對光譜的。爲了繪製音量，你可以從字面上使用波形本身（或者它是方形的，在技術上更精確）。 – wim 2012-02-13 01:57:06

這種證實了我的懷疑。你能詳細闡述一些細節（首選模塊，「方形」或其他有用的東西）嗎？ – Scott 2012-02-13 02:04:39

您需要將mp3文件解碼爲PCM波形，您可以將其存儲在「numpy」數組中。 – wim 2012-02-13 02:08:19

MP3文件是波形的編碼版本。在使用波形之前，您必須先將MP3數據解碼爲PCM波形。一旦獲得PCM數據，每個採樣代表該時間點的波形幅度。如果我們假設MP3解碼器輸出帶符號的16位值，則幅度範圍將從-16384到+16383。如果通過將每個樣本除以16384來標準化樣本，則波形樣本的範圍將介於+/- 1.0之間。

這個問題確實是MP3解碼到PCM的問題之一。據我所知，沒有本地的Python解碼器。但是，您可以使用LAME，從python調用它作爲子流程，或者稍微多做一些工作，將LAME庫直接連接到像SWIG之類的Python。不是一項簡單的任務。

繪製該數據然後成爲讀者的練習。

來源

2012-02-13 02:35:41 sizzzzlerz