2012-11-29 37 views
0

我正在構建一個隱馬爾可夫模型來識別是否有人在說「是」或「否」。我已經開發了隱馬爾可夫模型和我所遇到的教程從這個頁面:Viterbi搜索 - 假設概率

http://www.cslu.ogi.edu/tutordemos/nnet_recog/recog.html 

而在本教程中,它說:

這個數字追溯了「是」的搜索路徑和「否「通過假設的概率矩陣。即使「不」的分數非常低,如果「是」沒有出現在我們的詞彙中,仍然可以找到這個詞的最可能路徑。維特比搜索可以通過下面的僞代碼算法閱讀理解(在語音識別與符號從Rabiner的論文,A教程隱馬爾可夫模型借用和所選應用程序):

我已經通過雙方的閱讀論文和我仍然困惑,他們說:

through a hypothetical matrix of probabilities 

我的問題是這是什麼概率矩陣來自?例如,我做了如下:

  • 讀取音頻文件
  • ,去掉了不值得考慮的音頻信號
  • 拆分warrent考慮成塊

此信號意味着我留下了包含音素的塊。我已經計算出的數據的過零點,並由此引出了我的觀點:

爲「否」的數據來自這是非常低的,

爲「是」的數據來自這是非常高。

因此在本例中(上面給出的),它說:

Even though the score for "no" is very low, 

所以我能不能在結果通過從零交叉作爲我的概率?我很困惑,希望有人能幫助我。

回答

2

從哲學意義上說,這個概率矩陣來自自然界。更嚴重的是,這個矩陣代表了過渡矩陣的思想,如果一個人不知道自然的真實分佈(沒有人會這樣做),它可以由鮑姆韋爾奇在抽樣數據上計算出來。這就是爲什麼他們說這是假設。

關於第二個問題,您需要通過將Baum Welch應用於零交叉樣本來獲得Transition矩陣(概率)(我不確定過零樣本是什麼,通常使用的是mfcc)那類的東西)。

讓我知道是否需要更多的說明或者我誤解了某些東西。