2011-12-02 19 views
2

我需要編寫一個語音檢測算法(不是語音識別)。如何做一個體面的語音檢測?

起初我以爲我只需測量話筒功率並將其與某個閾值進行比較。但是,一旦必須考慮環境聲級時,問題會變得更加困難(例如,在酒吧中,由於其他人正在談話而立即超越了簡單的功率閾值)。

所以在第二個版本中,我認爲我必須測量當前的功率尖峯與平均聲級或類似的東西。編碼這個想法對我來說證明是相當有趣的,在這一點上我決定研究已有的解決方案。

你知道關於語音檢測的一些通用算法描述嗎? C/C++/Objective-C中的現有代碼或庫也很好,無論是商業還是免費。

P.S.我猜「語音」和「聲音」識別有區別,第一個只對接近人類語音範圍的頻率做出反應。我對第二個更簡單的案例很滿意。

回答

4

Google需要的關鍵詞是Voice Activity Detection(VAD) - 它在電信中廣泛使用,特別是在Acoustic Echo Cancellation(AEC)中。

+0

謝謝!我之前已經看過這個詞,甚至Google了,但是結果中的所有科學文章都讓我害怕得太早。現在我已經爲查詢添加了「Python」,這使得結果對我來說更具可讀性:) – zoul

+0

@zoul:請務必返回此處發佈您的調查結果 –