2012-02-04 67 views
0

我想基於其音頻內容,即音頻視頻數據的不同部分將被分割並歸類爲沉默的一個項目,我有段工作和分類在線視聽資料,音樂內容分析,語音,語音+背景音樂等基於其音頻內容。音頻在線視聽數據

我知道,我必須獲得音頻部分從視聽數據和提取功能,如過零點,譜峯等,並找出段邊界,以段音頻數據。

但我在開始的時候本身丟失。

我不知道如何與項目開始。該軟件的輸出是不同的類別,如沉默,語音,音樂等視聽下數據的分段

這將是真正有用的,如果有人讓我知道

  • 的編程語言,方便用於此目的?
  • 爲了開發這個軟件,我應該遵循哪些步驟?

我有在數字信號處理沒有背景。如果我得到一些指導

回答

0

我建議尋找到一個多媒體框架,如GStreamer這將是很有益的。它是跨平臺的,但最容易從Linux開始。它已經配備了各種插件來接收,解複用和解碼音頻和視頻。它還有幾個分析儀(如音頻水平和頻譜分析儀以及語音活動檢測)。這些可能是您實驗的一個很好的起點。 Gstreamer本身是用C編寫的,但是應用程序可以使用Python,Perl,C#,C++,Java等語言的綁定...