捕獲發送給Google語音識別服務器的音頻

以識別Google服務器的語音，我使用SpeechRecognizer類與RecognitionListener結合使用，如Stephan的answer至this question中所建議的。此外，我試圖捕獲音頻信號通過onBufferReceived（）回調從RecognitionListener像被認可：捕獲發送給Google語音識別服務器的音頻

byte[] sig = new byte[500000] ; 
int sigPos = 0 ; 
... 
public void onBufferReceived(byte[] buffer) { 
    System.arraycopy(buffer, 0, sig, sigPos, buffer.length) ; 
    sigPos += buffer.length ; 
} 
...

這似乎是做工精細，除了當SpeechRecognizer無法連接到谷歌服務器上，當音頻的塊是未複製到上述sig數組中，並且引發HTTP連接超時異常。 SpeechRecognizer最終連接到Google服務器，識別結果表明已收到完整的音頻信號;只有sig陣列缺少一些音頻塊。

有沒有人遇到同樣的問題？任何提示解決方案？謝謝！

來源

2011-05-08 Dusan

您是如何處理sig以獲取原始音頻信號以識別丟失的塊的？ – ComputerEngineer88 2012-03-14 07:34:23

我傾向於認爲這可能是識別服務行爲的不一致，甚至可能是您使用的Android版本中的錯誤。但是，文檔指出，不保證此方法被調用，因此它符合規範。我目前注意到的是以下內容（在Android 2.3.4上）：我在記錄時獲取字節，但如果有例如SocketTimeout，它會在一段時間後嘗試向服務器重新發送數據，但不要再撥打onBufferReceived相同的數據。用於測試的代碼與您在發佈中鏈接的代碼相同。

爲什麼您認爲在該方法中收到的音頻中缺少一些塊？如果只有幾塊缺失，甚至可能是這種情況，儘管這些塊缺失，但承認起作用。

來源

2011-05-10 06:56:53 Stephan

在現代版本的onBufferReceieved不起作用，您可以檢查record/save audio from voice recognition intent。

來源

2016-02-03 15:26:38

捕獲發送給Google語音識別服務器的音頻

回答

相關問題