語音識別失敗，因爲背景噪聲

我努力學習，用語音識別應用程序的工作，找啊找太久，發現了很多有用的信息和指南的..語音識別失敗，因爲背景噪聲

最後我發現用這個項目：HERE

它的工作完美，直到我有一些喧鬧的背景樣本試過..

我試圖用聽寫一起添加自定義的語法，使用自定義語法只，但仍得到相同的結果試圖（或更糟）..

_speechRecognitionEngine.LoadGrammar(_dictationGrammar); 
     _speechRecognitionEngine.LoadGrammar(new Grammar(new GrammarBuilder(new Choices("a", "b", "c", 
      "d","e","f","g","h","i","j","k","l","m","n","o","p","q","r","s","t","u", 
      "v","w","x","y","z","please","type","the","letters","you","hear"))) { Name = "NewGrammar" }); 
     _speechRecognitionEngine.RecognizeAsync(RecognizeMode.Multiple);

總是相同的結果：請鍵入字母，您聽到它的工作人員..

始終任何信件的結果是：其工作人員。

那麼，有什麼辦法來減少背景噪音？或編輯WAV樣本？

和一個新手問題：是否可以使用一些音頻樣本作爲選擇？（以字節讀取，然後比較或不管）。

音頻採樣測試：Audio Sample

此示例正確結果應該是：請鍵入字母，您聽到^ hÇd V A。

來源

2014-10-09 Dr.Vision

有一點解釋的評論會比投票下來更好！謝謝。 – 2014-10-09 10:21:54

你能檢查你提供的樣品嗎？我無法正確聽到它，這是'soxi'在其上運行的輸出：「soxi FAIL格式：無法打開輸入文件'HCDVA.wav'：WAVE：找不到RIFF頭」 – lCapp 2014-10-10 15:15:12

I Used Spectro並得到這些值：採樣率：22KHz 通道：1 每樣品比特數：16 大小：0.27MB 平均比特率：353kbps .... – 2014-10-11 02:59:55

我正在探索一個類似的問題。您可能會通過具有噪音刪除功能和腳本或命令行模式的其他應用程序（如Audacity's或Sox）過濾有問題的文件。這些可以使用Process class從C＃程序中調用。

或者，有一個商業許可的.NET庫用於此目的https://visualstudiogallery.msdn.microsoft.com/53d1f3fc-44d2-4a53-8211-99ca4b70536d。

來源

2016-03-01 04:44:24 jonnybot

語音識別失敗，因爲背景噪聲

回答

相關問題