2012-05-13 90 views
0

我正在做一些基本的命令識別並使用Google Search Input API。但是我想自己捕捉音頻,預處理音頻(去噪,提升幅度等),將這些修改過的音頻發送給識別器並獲取結果。可能嗎?在android語音輸入識別器中預處理音頻

我知道你可以使用SpeechRecognizerRecognitionListener來使用onBufferReceived方法獲得音頻。但是我想做預處理而不是後處理。是否有任何解決方法/黑客來處理谷歌識別器處理的數據?

回答

0

預處理音頻(降噪,提升幅度等),發送這些修改後的音頻到識別和獲取結果

一般的語音識別系統,從這個苦。不正確地執行去噪會降低語音識別的準確性,因爲它會以不可預測的方式破壞頻譜。幅度提升無助於因爲幅度在語音識別的最初階段被歸一化。你的預處理只能傷害。

如果你仍然想嘗試一下,嘗試pocketsphinx

http://cmusphinx.sourceforge.net/2011/05/building-pocketsphinx-on-android/

+0

THX的關於與降噪陷阱尖端。我已經測試過獅身人面像,但它提供的應用程序真的很差,所以我想使用谷歌識別器。是逆向工程android識別器活動做預處理的唯一方法呢? – pzo