我需要關於這個想法的一些建議,我曾經爲UNI項目提供過一些建議。在錄音中檢測不同的聲音/來源
我想知道是否有可能將音頻文件從不同的音頻源分成不同的「流」。 例如,將音頻文件拆分爲:發動機噪音,火車噪音,語音,所有時間不存在的不同聲音等。
我不一定需要用編程語言來做這件事(儘管它會是理想的),但也可以通過使用Sound Forge等聲音處理軟件進行手動操作。不過,我需要知道這是否可能。我對聲音處理一無所知。
第一階段完成後(分離聲音)我想確定是否有一個處理後的聲音存在於另一個錄音中。目的是完善的檢測。對於(理想的)例子,取汽車發動機的聲音並將其與另一個文件相匹配,並確定該聲音是否是汽車發動機的記錄。它不需要那麼精確,我想要檢測一個不是恆定的聲音,就像一個鳴鐘!也會好起來的。
我會做編程的一部分,我只是需要一些關於什麼尋找(軟件,數學等)的指針。由於我不是專家,如果可能的話,這將是一個有趣的項目。
謝謝。
事實上,我期望在手動完成時將聲音分離爲***中的痛苦(或者甚至不可能)。這就是爲什麼我想使用有限數量的聲音,我將不得不分開並使用第2步。謝謝。 – user3481244
@ user3481244:或許我應該多說一點。沒有** hte **發動機聲音這樣的東西,就有一整套發動機般的聲音。即使在混合信號中識別課程也相當容易。但是你沒有完全匹配,因此你不能減去確切的發動機聲音。當你減去估計值時,相對於原始聲音的誤差可能較小,但相對於剩餘聲音而言,誤差並不小。 – MSalters