測量音頻噪聲水平

我試圖獲得音頻流中存在的靜態或噪聲量的定性句柄。流的正常內容是語音或音樂。測量音頻噪聲水平

我已經experiementing與取樣品的STDDEV，這確實給我一些處理語音與空信道噪聲的情況下（即高STDDEV通常表明語音或音樂）

想知道是否有人有這方面的一些指針。

2009-08-17 Trevor Harrison

峯值是不是給你答案？如果你正在查看一個好的ADC的信號，環境電平應該在1或10的計數，而語音或音樂將達到成千上萬的計數。是否有某種自動增益控制可以使此策略無效？

如果您需要更復雜的東西，峯值與RMS比率可能比簡單RMS水平（RMS = stddev）更可靠。純噪聲的比例約爲3-5，而正弦波的RMS與RMS比值爲1.4。但是，您可以通過查看信號的spectrum來獲得更多的歧視。靜態通常在光譜上平滑或甚至平坦，而聲音和音樂在光譜上是結構化的。所以傅立葉變換可能是你正在尋找的。假設一個包含信號x，比方說0.5秒鐘的數據，這裏的一些Matlab代碼：

Sx = fft(x .* hann(length(x), 'periodic'))

的HANN函數施加Hann窗以減少頻譜泄漏，而FFT功能迅速計算傅立葉變換。現在你有幾個選擇。如果你想確定信號x是否包含靜態或語音/音樂，拿峯頻譜的RMS比：

pk2rms = max(abs(Sx))/sqrt(sum(abs(Sx).^2)/length(Sx))

我預計純靜態有一個峯周圍的3- RMS比5（再次），而語音/音樂至少要高一個數量級。這利用了純白噪聲在時域和頻域具有相同「結構」的事實。

如果你想獲得的噪聲水平的數字估計，可以在SX隨着時間的計算功率，使用平均：

Gxx = ((k-1)*Gxx + Sx.*conj(Sx))/k

隨着時間的推移，在的Gxx峯應該來來去去，但你應該看到一個與噪底相對應的恆定最小值。一般來說，音頻頻譜更容易在dB（對數垂直）尺度上查看。

一些注意事項：
1.我選擇了0.5秒的長度x，但我不確定這裏的最佳值是多少。如果你選擇一個太短的值，x將不會有太多結構。在這種情況下，信號的直流分量將具有很大的能量。不過，如果你首先拋出對應於DC的Sx中的bin，我希望你仍然可以使用峯值到RMS鑑別器。
2.我不確定k的值是多少，但該公式對應於exponential averaging。你可以嘗試用k來找出最佳值。這可能最適合短x。

來源

2009-08-18 03:40:32 mtrw

有不同種類的噪音。白色，粉紅色，棕色。噪音可能來自許多地方。是60赫茲的嗡嗡聲或信號？

對於白噪聲，我會看看fft並找到最低值以查看噪底是多少。

來源

2009-08-30 17:41:24 Nosredna

測量音頻噪聲水平

回答

相關問題