在錄音中檢測不同的聲音/來源

我需要關於這個想法的一些建議，我曾經爲UNI項目提供過一些建議。在錄音中檢測不同的聲音/來源

我想知道是否有可能將音頻文件從不同的音頻源分成不同的「流」。例如，將音頻文件拆分爲：發動機噪音，火車噪音，語音，所有時間不存在的不同聲音等。

我不一定需要用編程語言來做這件事（儘管它會是理想的），但也可以通過使用Sound Forge等聲音處理軟件進行手動操作。不過，我需要知道這是否可能。我對聲音處理一無所知。

第一階段完成後（分離聲音）我想確定是否有一個處理後的聲音存在於另一個錄音中。目的是完善的檢測。對於（理想的）例子，取汽車發動機的聲音並將其與另一個文件相匹配，並確定該聲音是否是汽車發動機的記錄。它不需要那麼精確，我想要檢測一個不是恆定的聲音，就像一個鳴鐘！也會好起來的。

我會做編程的一部分，我只是需要一些關於什麼尋找（軟件，數學等）的指針。由於我不是專家，如果可能的話，這將是一個有趣的項目。

謝謝。

來源

2014-03-31 user3481244

這是極其很難做到從單個音頻流中自動分離源碼。這個任務你的大腦非常擅長，它也從立體聲信號中受益。

例如，聲音充滿了並非一直存在的信號。汽車噪音具有非常靜止的部件，但是齒輪變化是異常的。

不幸的是，沒有簡單的答案。

來源

2014-03-31 14:15:49 MSalters

事實上，我期望在手動完成時將聲音分離爲***中的痛苦（或者甚至不可能）。這就是爲什麼我想使用有限數量的聲音，我將不得不分開並使用第2步。謝謝。 – user3481244

@ user3481244：或許我應該多說一點。沒有** hte **發動機聲音這樣的東西，就有一整套發動機般的聲音。即使在混合信號中識別課程也相當容易。但是你沒有完全匹配，因此你不能減去確切的發動機聲音。當你減去估計值時，相對於原始聲音的誤差可能較小，但相對於剩餘聲音而言，誤差並不小。 – MSalters

將參考信號與音頻流相關聯。使用FFT可以有效地完成相關。相關性計算的輸出可以在信號識別的時間內進行閾值化和「去抖」。

來源

2016-03-31 12:12:42 Scott

在錄音中檢測不同的聲音/來源

回答

相關問題