我正在構建一個隱馬爾可夫模型來識別是否有人在說「是」或「否」。我已經開發了隱馬爾可夫模型和我所遇到的教程從這個頁面:Viterbi搜索 - 假設概率
http://www.cslu.ogi.edu/tutordemos/nnet_recog/recog.html
而在本教程中,它說:
這個數字追溯了「是」的搜索路徑和「否「通過假設的概率矩陣。即使「不」的分數非常低,如果「是」沒有出現在我們的詞彙中,仍然可以找到這個詞的最可能路徑。維特比搜索可以通過下面的僞代碼算法閱讀理解(在語音識別與符號從Rabiner的論文,A教程隱馬爾可夫模型借用和所選應用程序):
我已經通過雙方的閱讀論文和我仍然困惑,他們說:
through a hypothetical matrix of probabilities
我的問題是這是什麼概率矩陣來自?例如,我做了如下:
- 讀取音頻文件
- ,去掉了不值得考慮的音頻信號
- 拆分warrent考慮成塊
此信號意味着我留下了包含音素的塊。我已經計算出的數據的過零點,並由此引出了我的觀點:
爲「否」的數據來自這是非常低的,
爲「是」的數據來自這是非常高。
因此在本例中(上面給出的),它說:
Even though the score for "no" is very low,
所以我能不能在結果通過從零交叉作爲我的概率?我很困惑,希望有人能幫助我。