音頻在線視聽數據

我想基於其音頻內容，即音頻視頻數據的不同部分將被分割並歸類爲沉默的一個項目，我有段工作和分類在線視聽資料，音樂內容分析，語音，語音+背景音樂等基於其音頻內容。音頻在線視聽數據

我知道，我必須獲得音頻部分從視聽數據和提取功能，如過零點，譜峯等，並找出段邊界，以段音頻數據。

但我在開始的時候本身丟失。

我不知道如何與項目開始。該軟件的輸出是不同的類別，如沉默，語音，音樂等視聽下數據的分段

這將是真正有用的，如果有人讓我知道

的編程語言，方便用於此目的？
爲了開發這個軟件，我應該遵循哪些步驟？

我有在數字信號處理沒有背景。如果我得到一些指導

來源

2012-02-04 user1188979

我建議尋找到一個多媒體框架，如GStreamer這將是很有益的。它是跨平臺的，但最容易從Linux開始。它已經配備了各種插件來接收，解複用和解碼音頻和視頻。它還有幾個分析儀（如音頻水平和頻譜分析儀以及語音活動檢測）。這些可能是您實驗的一個很好的起點。 Gstreamer本身是用C編寫的，但是應用程序可以使用Python，Perl，C＃，C++，Java等語言的綁定...

來源

2012-02-27 08:43:52 ensonic

音頻在線視聽數據

回答

相關問題