2014-03-31 51 views
1

我需要關於這個想法的一些建議,我曾經爲UNI項目提供過一些建議。在錄音中檢測不同的聲音/來源

我想知道是否有可能將音頻文件從不同的音頻源分成不同的「流」。 例如,將音頻文件拆分爲:發動機噪音,火車噪音,語音,所有時間不存在的不同聲音等。

我不一定需要用編程語言來做這件事(儘管它會是理想的),但也可以通過使用Sound Forge等聲音處理軟件進行手動操作。不過,我需要知道這是否可能。我對聲音處理一無所知。

第一階段完成後(分離聲音)我想確定是否有一個處理後的聲音存在於另一個錄音中。目的是完善的檢測。對於(理想的)例子,取汽車發動機的聲音並將其與另一個文件相匹配,並確定該聲音是否是汽車發動機的記錄。它不需要那麼精確,我想要檢測一個不是恆定的聲音,就像一個鳴鐘!也會好起來的。

我會做編程的一部分,我只是需要一些關於什麼尋找(軟件,數學等)的指針。由於我不是專家,如果可能的話,這將是一個有趣的項目。

謝謝。

回答

0

這是極其很難做到從單個音頻流中自動分離源碼。這個任務你的大腦非常擅長,它也從立體聲信號中受益。

例如,聲音充滿了並非一直存在的信號。汽車噪音具有非常靜止的部件,但是齒輪變化是異常的。

不幸的是,沒有簡單的答案。

+0

事實上,我期望在手動完成時將聲音分離爲***中的痛苦(或者甚至不可能)。這就是爲什麼我想使用有限數量的聲音,我將不得不分開並使用第2步。謝謝。 – user3481244

+0

@ user3481244:或許我應該多說一點。沒有** hte **發動機聲音這樣的東西,就有一整套發動機般的聲音。即使在混合信號中識別課程也相當容易。但是你沒有完全匹配,因此你不能減去確切的發動機聲音。當你減去估計值時,相對於原始聲音的誤差可能較小,但相對於剩餘聲音而言,誤差並不小。 – MSalters

0

將參考信號與音頻流相關聯。使用FFT可以有效地完成相關。相關性計算的輸出可以在信號識別的時間內進行閾值化和「去抖」。