2016-04-09 70 views
0

我已經實現了一個使用自動編碼器的音素分類器(給定一個音頻文件數組,它返回所有識別的音素)。我想擴展這個項目,以便可以識別單詞。是否存在一個已經訓練過的HMM模型(用英語)能夠識別給出音素列表的單詞?已經訓練過HMM模型,用於識別文字

謝謝大家。

回答

0

我不知道任何解碼器可以幫助你。語音識別軟件不能以這種方式工作。

通常這樣的事情需要自定義實現動態束搜索。這不是一項巨大的任務,也許是100行代碼。它也取決於你的語音解碼器產生什麼。這是語音格(理想)還是1分最好的結果,或者只有1分最好的結果,沒有得分。

如果你有一個合適的格子,你可能想嘗試openfst工具箱,在這裏你將LM和字典轉換成FST,然後用格子FST進行組合,然後使用fstbestpath來找到最佳路徑。儘管如此,你可以簡單地寫一個動態搜索,而不是所有那些語音轉換。

百度在他們的項目中也將語音轉換爲字母,然後使用語言模型來修復字母順序。但他們表示,如果沒有語言模式,它同樣適用。