0

我正在使用HM來分離單詞的語音識別。我已經爲我的數據庫訓練了我的Hmms。我計算並比較傳入音頻信號的似然概率。我遇到的問題是不同的詞具有不同數量的最佳狀態,這將給予不同數量的搜索路徑(搜索路徑的數量=狀態^觀察值),因此不能比較概率。我如何正常化不同數量的狀態的影響?使用HMM進行語音識別

回答

4

您需要上下文無關語法或語言模型(通常是3-gram概率模型)來識別話語而不是單個單詞。然後使用適當的算法計算每條路徑的分數。我強烈建議你看看現有的解決方案,如KaldiCMUSphinx