在android語音輸入識別器中預處理音頻

我正在做一些基本的命令識別並使用Google Search Input API。但是我想自己捕捉音頻，預處理音頻（去噪，提升幅度等），將這些修改過的音頻發送給識別器並獲取結果。可能嗎？在android語音輸入識別器中預處理音頻

我知道你可以使用SpeechRecognizer和RecognitionListener來使用onBufferReceived方法獲得音頻。但是我想做預處理而不是後處理。是否有任何解決方法/黑客來處理谷歌識別器處理的數據？

2012-05-13 pzo

預處理音頻（降噪，提升幅度等），發送這些修改後的音頻到識別和獲取結果

一般的語音識別系統，從這個苦。不正確地執行去噪會降低語音識別的準確性，因爲它會以不可預測的方式破壞頻譜。幅度提升無助於因爲幅度在語音識別的最初階段被歸一化。你的預處理只能傷害。

如果你仍然想嘗試一下，嘗試pocketsphinx

2012-05-15 05:16:38

THX的關於與降噪陷阱尖端。我已經測試過獅身人面像，但它提供的應用程序真的很差，所以我想使用谷歌識別器。是逆向工程android識別器活動做預處理的唯一方法呢？ – pzo

回答