4
我需要能夠確定兩個聲音是否非常相似。我們的目標是要有一個非常有限的詞組(10或15個)短的一個或兩個音節詞,然後比較一個捕獲的聲音,以確定它是否是具有環境和捕獲條件中所有常見變化的項目之一。這個想法是,用戶可以通過語音而不是鍵盤或鼠標發出一些簡單的命令。比較兩個語音
有沒有人知道最好的方法呢?我不想做全面的語音識別,只是更有限的一些。
我需要能夠確定兩個聲音是否非常相似。我們的目標是要有一個非常有限的詞組(10或15個)短的一個或兩個音節詞,然後比較一個捕獲的聲音,以確定它是否是具有環境和捕獲條件中所有常見變化的項目之一。這個想法是,用戶可以通過語音而不是鍵盤或鼠標發出一些簡單的命令。比較兩個語音
有沒有人知道最好的方法呢?我不想做全面的語音識別,只是更有限的一些。
我會重新考慮使用語音識別庫......如CMU's Sphinx軟件或Microsoft's speech recognizer。不幸的是,這並不是一項簡單的任務。一種方法是有些典型的如何完成你正在嘗試做的是如下:
1)印章的樣品成小片段(幾毫秒)
2)傅立葉每個段變換,收集校長係數
3)使用隱馬爾可夫模型計算出音素的可能變換給您係數
的序列4)映射到字典描繪音素的話(你可以看看獅身人面像字典作爲一個指南)......像你這樣的小組應該會產生出色的結果。
如果你想在一定程度上簡化了這一點,你可以嘗試採用係數在特定的時間步長,並將它們送入一個SVM或神經網絡...我沒有試過,但還敢打賭,你可以得到合理的結果進行一些調整。
這是說話者獨立的,還是要爲特定的說話者訓練? – 2010-05-28 21:38:31
聽起來有趣!我會對你得到的任何答案感興趣。我所知道的關於言語的是,「形式」(頻譜中的主峯)可以用來識別語言元素。我不確定真的語音識別軟件是否使用該軟件。 – erickson 2010-05-28 21:40:43
您正在尋找「語音識別」。 – 2010-05-28 21:41:54