考慮多個(至少兩個)不同的音頻文件,如多種不同的混音或混音。天真地說,如果人聲樣本沒有被修改,拉伸,傾斜,混響太多,那麼當然只有在這樣的情況下,才能檢測出兩個或更多文件中幾乎相同的樣本,特別是人聲等等。在相同的短樣本中搜索不同的音頻文件
那麼用什麼樣的算法或技術可以做到這一點?比方說,用戶會嘗試在所有文件中儘可能設置時間標記,這些時間標記描述要比較的數據窗口,其中包含大概相等的聲音,人聲等。
我知道沒有直接的方法,試圖直接比較wav數據以任何方式都是有用的。但即使我有頻域數據(例如來自FFT),我也必須使用比較算法,這種比較算法可以通過時間尺度來移動比較窗口,因爲我不能假設我想要找到的樣本是時間同步的覆蓋所有文件。
在此先感謝您的任何建議。
你有比較音頻文件的任何成功? – AVEbrahimi