考慮一種情況,即您有多個麥克風,每個麥克風都能夠通過WiFi網絡傳輸他們拾取的音頻(這意味着音頻可以延遲數毫秒或更長時間)。是否有一種算法來組合來自多個麥克風的音頻以改善音頻質量?
是否有一種算法可以結合來自多個麥克風的音頻來產生更高質量的音頻記錄,檢測並糾正任何時間延遲?
考慮一種情況,即您有多個麥克風,每個麥克風都能夠通過WiFi網絡傳輸他們拾取的音頻(這意味着音頻可以延遲數毫秒或更長時間)。是否有一種算法來組合來自多個麥克風的音頻以改善音頻質量?
是否有一種算法可以結合來自多個麥克風的音頻來產生更高質量的音頻記錄,檢測並糾正任何時間延遲?
要檢測/更正時間延遲,您可能需要查找"feature extraction"。它確定音頻中的關鍵點以匹配。
儘管如此,如果所有麥克風都聽到(大致)相同的聲音,這種方法效果最佳。對於工作室式的環境,每個麥克風都是定向的,針對不同的樂器,可能很難確定常見的功能。
雖然我不確定「更高質量」對您意味着什麼。我假設你的意思是最少的噪音。如果是這樣的話,你可能會對this answer感興趣,這是關於噪聲檢測的。您可以計算每個輸入的信噪比,並根據您認爲合適時的權重對它們進行加權。
還有其他方法可以降低噪音。您可以簡單地在每個輸入或混合輸出上運行許多noise reduction技術之一。
如果你的意思是「質量」的其他內容,那麼你可能會進入更難的領域。專業調音師有理由獲得報酬,因爲電腦並不善於說出「更好」的聲音。
當然,根本不需要重新發明輪子。有可能有幾個開源的程序做這種東西。我認爲Audacity source會擁有你想要的一切。
我記得的應用實際上更像是一個電話會議的情況 - 你有多個人坐在桌子周圍,有多個麥克風。根據麥克風和揚聲器的不同,音頻質量和音量會有所不同,以及任何音頻位移。這個想法將結合來自各種麥克風的音頻以提供來自不同人說話的清晰音頻。 – sanity
嗯。在那種情況下,我認爲總的想法是一樣的。不過,您可能不想合併來自所有麥克風的音頻。比較每個的相對音量和信號/噪聲,並選擇最佳。如果沒有人超過你的門檻,結合最好的兩個。一旦混合,可能會運行降噪和自動增益控制。我不認爲你會爲此找到一個「算法」,因爲它是一個相當廣泛的主題。 – Geobits
謝謝,是的 - 我更希望得到一些通用的指針,以確保在我嘗試提出自己的解決方案之前,我沒有忽視任何東西。 – sanity