我想開始一個大項目,它需要比較兩個音頻文件以獲得匹配百分比。比較兩個音頻文件。聲音匹配
實施例:
音頻A是原始音頻。
audo B從麥克風錄音。 (除了語音之外,所有內容與音頻A中的相同)
我想知道B以百分比的方式接近A的機率。 (100%=相同)
有誰知道一種方法如何做到這一點?
也許這可能與文件B的光譜對比文件A的頻譜可能..
我想開始一個大項目,它需要比較兩個音頻文件以獲得匹配百分比。比較兩個音頻文件。聲音匹配
實施例:
音頻A是原始音頻。
audo B從麥克風錄音。 (除了語音之外,所有內容與音頻A中的相同)
我想知道B以百分比的方式接近A的機率。 (100%=相同)
有誰知道一種方法如何做到這一點?
也許這可能與文件B的光譜對比文件A的頻譜可能..
我在本科課程項目但圖像文件做這樣的事情。你想看的東西是Cross-correlation。您可以在其中測量兩個信號之間的相似性。您也可能需要預處理音頻文件,即:標準化,應用一些低通濾波器來消除噪音。
我會建議奧本海姆的數字信號處理,以深入理解信號處理。
但是,這些技術都很模糊,直到yopu知道你想找到什麼類型的相似點。
爲了跟進圖像比較,有一家公司(LTU)具有基於矢量比較圖像的應用程序,然後比較矢量,這反映了2幅圖像之間的差異。這不是字節/字節的比較,它匹配裁剪和倒置的圖像。也許他們的技術可以適應音頻文件。這就是說,我懷疑你可以接受他們的算法。 –
@ Nick.T但是,我認爲必須有一些開源項目來做這些事情。 –
我只知道它,因爲客戶對我說「我想要LTU」。所以沒有對我開源項目的研究。我確實同意這種算法必須存在於開源項目中。也許這個問題可以在'mathematica'堆棧中重新設置和詢問... –
這一切都取決於你是什麼意思的「比較兩個音頻文件」。 100%很容易想象,但0%怎麼樣?正如你所看到的,「音頻文件比較」的定義沒有很好的定義,所以你的解決方案也不會被定義。是否應該根據知覺的角度來計算比較(兩個音頻文件的聲音相似),還是應該基於單純的字節 - 字節算術差異? –
你可能會寫一本關於聲音處理和比較的書,因此投票結束爲「過於寬泛」。 –
比較對你而言意味着什麼?你必須檢查聲樂和器樂。這可以幫助嗎? http://stackoverflow.com/questions/3673042/algorithm-to-remove-vocal-from-sound-track – SomeJavaGuy