2012-02-26 33 views
1

我是MS SAPI的新手,我正在嘗試使用SpeechRecognitionEngine類在C#/ Windows窗體中編寫WAV到TXT轉換實用程序。我注意到演講完全不正確。這些話聽起來並不相似。我猜這可能會受到一長串因素的影響,比如輸入WAV文件的音質和加載到識別引擎中的語法。我正在使用DictationGrammar類。MS SAPI SpeechRecognitionEngine在C#中完全錯誤的轉錄

我會很感激任何來自經驗豐富的語音識別/數字信號處理的人。

回答

0

有幾個原因可能會導致如此令人失望的結果。首先,如果您使用的是桌面識別器,則應該對揚聲器進行訓練。

第二個想法是,如果您要從Wav文件進行轉換,則在選擇該文件的格式時必須小心。您可能需要重新採樣wav文件,因爲語音識別引擎僅支持某些採樣率。每個樣品

  • 8位
  • 單通道單
  • 22050每秒
  • PCM編碼

作品以及在Windows樣品。有關更多信息,請參閱https://stackoverflow.com/a/6203533/90236

+0

謝謝,我在發表這篇文章後立即看到該帖子,我的歉意。我的WAV文件確實無效。在22050重新採樣並輸出爲無符號8位後,可識別語音的置信度從大約8%上升到50%以上。我認爲這很好? – user1229658 2012-02-28 21:05:38

+0

不需要道歉。這是一個很好的問題,文檔沒有明確指定支持的格式。最後我看了,知道支持的格式的唯一方法是編寫代碼來查詢SupportedAudioFormats。 – 2012-02-28 22:37:38