2013-01-02 64 views
6

我想開始一個大項目,它需要比較兩個音頻文件以獲得匹配百分比。比較兩個音頻文件。聲音匹配

實施例:

  1. 音頻A是原始音頻。

  2. audo B從麥克風錄音。 (除了語音之外,所有內容與音頻A中的相同)

  3. 我想知道B以百分比的方式接近A的機率。 (100%=相同)

有誰知道一種方法如何做到這一點?

也許這可能與文件B的光譜對比文件A的頻譜可能..

+1

這一切都取決於你是什麼意思的「比較兩個音頻文件」。 100%很容易想象,但0%怎麼樣?正如你所看到的,「音頻文件比較」的定義沒有很好的定義,所以你的解決方案也不會被定義。是否應該根據知覺的角度來計算比較(兩個音頻文件的聲音相似),還是應該基於單純的字節 - 字節算術差異? –

+0

你可能會寫一本關於聲音處理和比較的書,因此投票結束爲「過於寬泛」。 –

+0

比較對你而言意味着什麼?你必須檢查聲樂和器樂。這可以幫助嗎? http://stackoverflow.com/questions/3673042/algorithm-to-remove-vocal-from-sound-track – SomeJavaGuy

回答

2

我在本科課程項目但圖像文件做這樣的事情。你想看的東西是Cross-correlation。您可以在其中測量兩個信號之間的相似性。您也可能需要預處理音頻文件,即:標準化,應用一些低通濾波器來消除噪音。

我會建議奧本海姆的數字信號處理,以深入理解信號處理。

但是,這些技術都很模糊,直到yopu知道你想找到什麼類型的相似點。

+0

爲了跟進圖像比較,有一家公司(LTU)具有基於矢量比較圖像的應用程序,然後比較矢量,這反映了2幅圖像之間的差異。這不是字節/字節的比較,它匹配裁剪和倒置的圖像。也許他們的技術可以適應音頻文件。這就是說,我懷疑你可以接受他們的算法。 –

+0

@ Nick.T但是,我認爲必須有一些開源項目來做這些事情。 –

+0

我只知道它,因爲客戶對我說「我想要LTU」。所以沒有對我開源項目的研究。我確實同意這種算法必須存在於開源項目中。也許這個問題可以在'mathematica'堆棧中重新設置和詢問... –