2013-03-01 50 views
4

我目前正在討論階段的項目中使用語音識別,我使用了MFCC特徵提取,但函數返回的MFCC特徵是矩陣e,g。每個語音文件(wav)的(20,38)特徵矩陣。但是,我怎樣才能將這個特性傳遞給SVM分類器。對於SVM(以及其他分類器),每個樣本都由一個向量表示,對嗎?但每個樣本的MFCC特徵都是一個矩陣。假設Xi是樣本i的MFCC特徵,則樣本i傳遞給SVM的特徵爲: 1)20 * 38向量,例如, Xi(:)以matlab形式。 2)平均值(Xi)。 3)Xi中的一列或一列。 哪條路是對的?任何有用的代碼,紙?如何使用mfcc功能來訓練用於語音識別的svm分類器?

謝謝! 服務

+0

那麼,你是怎麼實現的呢? – 2018-01-25 20:49:34

回答

5

對於序列標記的任務,如語音識別,您需要使用SVM的組合HMM,而不僅僅是SVM

  1. 對齊功能矩陣國GMM-HMM,獲得對應於每個HMM狀態
  2. 功能
  3. 列車SVM上屬於每個國家
  4. 功能實現SVM-HMM代替FO GMM-HMM

要了解更多閱讀

http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.27.442

要想快點,利用現有的工具包,如:

http://www.cs.cornell.edu/people/tj/svm_light/svm_hmm.html

+0

謝謝!這對我很有幫助 – user1423164 2013-03-07 05:08:24