2012-05-08 174 views
3

我想記錄FM收音機的廣播流。無線電信號的音頻將輸入到計算機的輸入端。從廣播音頻流中檢測,如果它是語音或音樂

該音頻信號包含語音(說話的話)和音樂。我想實時識別它是音樂還是語音。也許頻率會做到這一點。如何實現這樣的東西?我知道這個線程Algorithm to determine if audio is music,但我的問題更簡單。

我希望有人有這樣的事情或可以告訴我從哪裏開始。做這件事最可愛的方式是一個程序,它監聽我的電腦的線路,並在檢測到語音或音樂變化時向另一個程序或腳本發送變化信號。其他程序或腳本將保存記錄,直到收到更改信號並進一步記錄。

目標是獲得僅包含音樂或語音的文件。

+1

關於你的問題沒有什麼簡單的。一點都不簡單! – Brad

+0

[算法來確定音頻是音樂]的可能的重複(http://stackoverflow.com/questions/5531949/algorithm-to-determine-if-audio-is-music) – Brad

+0

是什麼讓你的問題比(或只是不同於)「確定音頻是否是音樂的算法」?我知道你甚至想知道演講。這會讓事情變得更加複雜而不是簡單。如果你能詳細闡述一下,這將會很有幫助。 – AudioDroid

回答

0

頻率檢測是一個很好的開始。

「一個典型的成年男性的濁音將有一個基本頻率從85到180赫茲,而一個典型的成年女性從165到255赫茲。」 - 維基百科語音頻率。

隔離頻率將至少減少要進一步處理的數據量。低音樂器/聲音從50Hz左右開始聽起來可以從那裏開始工作,因此分析穩定/穩定節奏的音頻將是下一步。