2011-10-06 34 views
2

我想構建一個應用程序,分析話筒中語音的情感內容。語音中的情感檢測

雖然有時用作額外的功能,但並不涉及語音識別。情緒分析基於聲音的韻律特徵(音調變化,速度等,音調)。

我知道這可以在臺式電腦上完成,但我不希望用戶必須將他們的錄音(電話交談)上傳到服務器才能獲得情緒反饋。

我需要的是一個API,它提供了整個分析或一個API,我可以使用它來提取這些功能(即對話的平均速度)。

那裏有這樣的事嗎?

在此先感謝!

回答

5

入住這OpenEAR包,它應該設置在最新的狀態藝術水平都

http://sourceforge.net/projects/openart/

讀到它

http://www.mmk.ei.tum.de/publ/pdf/09/09eyb1.pdf

慕尼黑openEAR工具包是一個完整的軟件包自動語音情感識別。它的縮寫代表開放的情感和影響識別工具包。它基於openSMILE特徵提取器,因此能夠實時在線進行情緒識別。包括各種標準語料庫的預訓練模型,以及快速構建和評估自定義模型集的腳本和工具。目前包含的分類器是使用LibSVM庫的支持向量機。即將推出的還有雙向長短期記憶遞歸神經網絡,區分多標稱貝葉斯網絡和懶惰學習者。

openEAR是根據GPL許可證發放的免費軟件。第一個版本(包括模型集和預編譯的openSMILE)將很快在Sourceforge:openEAR上發佈。同時,請參閱我們提供特徵提取引擎的openSMILE項目。

+0

非常感謝您的關注! – jorrebor

+0

尼古拉,所以如果我沒有弄錯,如果我想將一個audiofile分類爲6種基本情緒類型中的一種(因爲它是在柏林數據庫中訓練的),那麼就不涉及訓練階段了?或者我需要實現分類器?但是分類器應該被正確地訓練?對不起,如果我問明顯。 感謝您的幫助 – jorrebor

+0

提供了預訓練模型,您可以使用它們而無需訓練,僅用於情緒檢測。提供分類器,您可以根據自己的需要進行修改。您還可以在自己的數據庫上訓練新模型。 –