MS SAPI SpeechRecognitionEngine在C＃中完全錯誤的轉錄

我是MS SAPI的新手，我正在嘗試使用SpeechRecognitionEngine類在C＃/ Windows窗體中編寫WAV到TXT轉換實用程序。我注意到演講完全不正確。這些話聽起來並不相似。我猜這可能會受到一長串因素的影響，比如輸入WAV文件的音質和加載到識別引擎中的語法。我正在使用DictationGrammar類。MS SAPI SpeechRecognitionEngine在C＃中完全錯誤的轉錄

我會很感激任何來自經驗豐富的語音識別/數字信號處理的人。

來源

2012-02-26 user1229658

有幾個原因可能會導致如此令人失望的結果。首先，如果您使用的是桌面識別器，則應該對揚聲器進行訓練。

第二個想法是，如果您要從Wav文件進行轉換，則在選擇該文件的格式時必須小心。您可能需要重新採樣wav文件，因爲語音識別引擎僅支持某些採樣率。每個樣品

8位
單通道單
22050每秒
PCM編碼

作品以及在Windows樣品。有關更多信息，請參閱https://stackoverflow.com/a/6203533/90236。

來源

2012-02-27 14:53:09

謝謝，我在發表這篇文章後立即看到該帖子，我的歉意。我的WAV文件確實無效。在22050重新採樣並輸出爲無符號8位後，可識別語音的置信度從大約8％上升到50％以上。我認爲這很好？ – user1229658 2012-02-28 21:05:38

不需要道歉。這是一個很好的問題，文檔沒有明確指定支持的格式。最後我看了，知道支持的格式的唯一方法是編寫代碼來查詢SupportedAudioFormats。 – 2012-02-28 22:37:38

MS SAPI SpeechRecognitionEngine在C＃中完全錯誤的轉錄

回答

相關問題