2014-10-09 34 views
1

我努力學習,用語音識別應用程序的工作, 找啊找太久,發現了很多有用的信息和指南的..語音識別失敗,因爲背景噪聲

最後我發現用這個項目:HERE

它的工作完美,直到我有一些喧鬧的背景樣本試過..

我試圖用聽寫一起添加自定義的語法,使用自定義語法只, 但仍得到相同的結果試圖(或更糟)..

_speechRecognitionEngine.LoadGrammar(_dictationGrammar); 
     _speechRecognitionEngine.LoadGrammar(new Grammar(new GrammarBuilder(new Choices("a", "b", "c", 
      "d","e","f","g","h","i","j","k","l","m","n","o","p","q","r","s","t","u", 
      "v","w","x","y","z","please","type","the","letters","you","hear"))) { Name = "NewGrammar" }); 
     _speechRecognitionEngine.RecognizeAsync(RecognizeMode.Multiple); 

總是相同的結果:請鍵入字母,您聽到它的工作人員..

始終任何信件的結果是:其工作人員。

那麼,有什麼辦法來減少背景噪音?或編輯WAV樣本?

和一個新手問題:是否可以使用一些音頻樣本作爲選擇? (以字節讀取,然後比較或不管)。

音頻採樣測試:Audio Sample

此示例正確結果應該是:請鍵入字母,您聽到^ hÇd V A

+0

有一點解釋的評論會比投票下來更好!謝謝。 – 2014-10-09 10:21:54

+0

你能檢查你提供的樣品嗎?我無法正確聽到它,這是'soxi'在其上運行的輸出: 「soxi FAIL格式:無法打開輸入文件'HCDVA.wav':WAVE:找不到RIFF頭」 – lCapp 2014-10-10 15:15:12

+0

I Used Spectro並得到這些值:採樣率:22KHz 通道:1 每樣品比特數:16 大小:0.27MB 平均比特率:353kbps .... – 2014-10-11 02:59:55

回答