2012-01-16 19 views
0

考慮多個(至少兩個)不同的音頻文件,如多種不同的混音或混音。天真地說,如果人聲樣本沒有被修改,拉伸,傾斜,混響太多,那麼當然只有在這樣的情況下,才能檢測出兩個或更多文件中幾乎相同的樣本,特別是人聲等等。在相同的短樣本中搜索不同的音頻文件

那麼用什麼樣的算法或技術可以做到這一點?比方說,用戶會嘗試在所有文件中儘可能設置時間標記,這些時間標記描述要比較的數據窗口,其中包含大概相等的聲音,人聲等。

我知道沒有直接的方法,試圖直接比較wav數據以任何方式都是有用的。但即使我有頻域數據(例如來自FFT),我也必須使用比較算法,這種比較算法可以通過時間尺度來移動比較窗口,因爲我不能假設我想要找到的樣本是時間同步的覆蓋所有文件。

在此先感謝您的任何建議。

+0

你有比較音頻文件的任何成功? – AVEbrahimi

回答

0

嗨,這是可能的!

您可以使用一種名爲LSH(局部敏感哈希)的技術,它非常強大。

另一種方式做,這是設法讓頻譜分析的音頻文件...

構建數據庫歌

1. Record your Full Song 
2. Transform the sound to spectrum 
3. slice your Spectrogram in chunk and get three or four high Frequencies 
4. Store all the points 

配合歌曲

1. Record one short sample. 
2. Transform the sound into another spectrum 
3. slice your Spectrogram in chunk and get three or four hight Frequencies 
4. Compare the collected frequencies with your database song. 
5. your match is the song with have the high hit ! 

你在這裏可以看到如何使..

http://translate.google.com/translate?hl=EN&sl=pt&u=http://ederwander.wordpress.com/2011/05/09/audio-fingerprint-em-python/

ederwander

+0

不幸的是,這更像是音頻指紋,這不是我想要的。我知道,我的兩個樣本很熟悉,我想要一種Vocal-Excerption和Vocal-Remove,並不能確定數據庫歌曲是否與樣本匹配。 –