2016-11-14 20 views
1

我正在分析Python中的音頻文件,特別是音樂音頻,並且我已經應用DFT(FFT)在頻域中獲取數據,但沒有進行大量搜索或擺弄它已經揭示了在頻率中識別「峯值」/局部最大值的好方法。我的數據非常嘈雜,應用傅里葉變換後的圖形示例如下。幫助將非常感激。我也在從這些數據中檢索MFCC係數,但我也不確定如何去做這件事,所以關於這個問題的知識也是有用的。如何識別FFT數據的局部最大值

FFT of Audio File

+0

我會簡單地做一個適當寬度的運行平均值(10Hz看起來像一個好的開始)來平滑你的數據,然後在去噪信號上尋找局部最大值... – Julien

+0

試試這個庫:https://github。 com/jameslyons/python_speech_features,「不要重複自己」,「不要重新發明輪子」 – eyllanesc

回答

0

首先,你需要通過運行一個低通濾波以平滑您(FFT)數據。之後,您可以在信號的梯度上找到過零點。您可以用[-1,1]過濾信號以找到漸變,並選取前一個元素爲正值且後續元素爲負值的元素。

相關問題