我努力學習,用語音識別應用程序的工作, 找啊找太久,發現了很多有用的信息和指南的..語音識別失敗,因爲背景噪聲
最後我發現用這個項目:HERE
它的工作完美,直到我有一些喧鬧的背景樣本試過..
我試圖用聽寫一起添加自定義的語法,使用自定義語法只, 但仍得到相同的結果試圖(或更糟)..
_speechRecognitionEngine.LoadGrammar(_dictationGrammar);
_speechRecognitionEngine.LoadGrammar(new Grammar(new GrammarBuilder(new Choices("a", "b", "c",
"d","e","f","g","h","i","j","k","l","m","n","o","p","q","r","s","t","u",
"v","w","x","y","z","please","type","the","letters","you","hear"))) { Name = "NewGrammar" });
_speechRecognitionEngine.RecognizeAsync(RecognizeMode.Multiple);
總是相同的結果:請鍵入字母,您聽到它的工作人員..
始終任何信件的結果是:其工作人員。
那麼,有什麼辦法來減少背景噪音?或編輯WAV樣本?
和一個新手問題:是否可以使用一些音頻樣本作爲選擇? (以字節讀取,然後比較或不管)。
音頻採樣測試:Audio Sample
此示例正確結果應該是:請鍵入字母,您聽到^ hÇd V A。
有一點解釋的評論會比投票下來更好!謝謝。 – 2014-10-09 10:21:54
你能檢查你提供的樣品嗎?我無法正確聽到它,這是'soxi'在其上運行的輸出: 「soxi FAIL格式:無法打開輸入文件'HCDVA.wav':WAVE:找不到RIFF頭」 – lCapp 2014-10-10 15:15:12
I Used Spectro並得到這些值:採樣率:22KHz 通道:1 每樣品比特數:16 大小:0.27MB 平均比特率:353kbps .... – 2014-10-11 02:59:55