我正在嘗試計算一部分聲音文件的功率譜圖。 目前我正在使用librosa。計算.wav文件的窗口上的功率譜圖
我正在計算我的windowsize 20 * 1e-3 * samplerate。 我想知道的結果(特別是t的長度)可以在下面的例子中看到:
44.1kHz的採樣率與20ms的時間幀相結合產生了一個882個採樣窗口。
In [2]: D = np.abs(librosa.stft(y[:882]))**2
In [3]: np.shape(D)
Out[4]: (1025, 2)
我得到的是我的結果中的2ms時間幀,這不是我所期望的。有人能幫助我/指出我做錯了什麼嗎?
請嘗試給出[MCVE]。也許添加一個你得到的圖,vs你的預期。從一些你理解的綜合數據開始,通常是一個好主意。看看這個頻譜圖問題,例如:http://stackoverflow.com/questions/35932145/plotting-with-matplotlib-specgram/35933996#35933996 – roadrunner66
你知道「20ms * 1e-3」是20微秒,對? – twalberg
嗯,是的 - 我的代碼正確,但不知何故在我的例子中標記爲錯誤。當然是20秒* 1e-3。 – soultice