5
我在閱讀本指南speech recognition,它提到我需要三個語音識別項目:聲學模型,語言模型,語音詞典。PocketSphinx python和設置聲學模型?
我想開始玩這個python demo,它使用Gstreamer從麥克風捕獲並重採樣到8kHz,16位PCM音頻。
我看到,我可以指定語言模型和語音字典,我用了一個[由CMU提供]:
http://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/US%20English%20HUB4%20Language%20Model/
但我很困惑,我應該指定聲學模型? gstreamer有我自己使用的自己的聲學模型嗎?我希望能使用這裏提供的聲學模型的效果會稍好一點:
http://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/US%20English%20HUB4%20Acoustic%20Model/
(很抱歉的超鏈接我不能發佈與代表小於10大於2個鏈接)