2012-11-30 67 views
5

我在閱讀本指南speech recognition,它提到我需要三個語音識別項目:聲學模型,語言模型,語音詞典。PocketSphinx python和設置聲學模型?

我想開始玩這個python demo,它使用Gstreamer從麥克風捕獲並重採樣到8kHz,16位PCM音頻。

我看到,我可以指定語言模型和語音字典,我用了一個[由CMU提供]:

http://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/US%20English%20HUB4%20Language%20Model/ 

但我很困惑,我應該指定聲學模型? gstreamer有我自己使用的自己的聲學模型嗎?我希望能使用這裏提供的聲學模型的效果會稍好一點:

http://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/US%20English%20HUB4%20Acoustic%20Model/ 

(很抱歉的超鏈接我不能發佈與代表小於10大於2個鏈接)

回答

3

但我很困惑我應該在哪裏指定聲學模型?

您可以使用gstreamer元素的hmm屬性指定模型。就像它的覆蓋教程

asr.set_property('lm', '/home/user/mylanguagemodel.lm') 

您可以使用

asr.set_property('hmm', '/home/user/acoustic_model_folder') 

的GStreamer是否有我含蓄地利用自身的聲學模型?

是,默認情況下它使用美國英語模型hub4wsj_sc_8k從分佈

相關問題