使用HMM進行語音識別

我正在使用HM來分離單詞的語音識別。我已經爲我的數據庫訓練了我的Hmms。我計算並比較傳入音頻信號的似然概率。我遇到的問題是不同的詞具有不同數量的最佳狀態，這將給予不同數量的搜索路徑（搜索路徑的數量=狀態^觀察值），因此不能比較概率。我如何正常化不同數量的狀態的影響？使用HMM進行語音識別

您需要上下文無關語法或語言模型（通常是3-gram概率模型）來識別話語而不是單個單詞。然後使用適當的算法計算每條路徑的分數。我強烈建議你看看現有的解決方案，如Kaldi或CMUSphinx。

2014-01-09 23:37:35

回答