已經訓練過HMM模型，用於識別文字

我已經實現了一個使用自動編碼器的音素分類器（給定一個音頻文件數組，它返回所有識別的音素）。我想擴展這個項目，以便可以識別單詞。是否存在一個已經訓練過的HMM模型（用英語）能夠識別給出音素列表的單詞？已經訓練過HMM模型，用於識別文字

謝謝大家。

2016-04-09 fxhh

我不知道任何解碼器可以幫助你。語音識別軟件不能以這種方式工作。

通常這樣的事情需要自定義實現動態束搜索。這不是一項巨大的任務，也許是100行代碼。它也取決於你的語音解碼器產生什麼。這是語音格（理想）還是1分最好的結果，或者只有1分最好的結果，沒有得分。

如果你有一個合適的格子，你可能想嘗試openfst工具箱，在這裏你將LM和字典轉換成FST，然後用格子FST進行組合，然後使用fstbestpath來找到最佳路徑。儘管如此，你可以簡單地寫一個動態搜索，而不是所有那些語音轉換。

百度在他們的項目中也將語音轉換爲字母，然後使用語言模型來修復字母順序。但他們表示，如果沒有語言模式，它同樣適用。

2016-04-15 15:04:53

回答