Python Speech_Recognition Bad Results

我想使用speech_recognition 3.1.2使用Python 3.4，但我一直在麻煩整個時間。Python Speech_Recognition Bad Results

最初嘗試使用剛剛的例子WAV識別我得到類型錯誤時：「STR」不支持緩衝區的接口，所以我通過源梳理，並提出了以下變化：從

def read(self, size = -1): 
     buffer = self.wav_reader.readframes(self.wav_reader.getnframes() if size == -1 else size) 
     if type(buffer) is str: 
      buffer = buffer.encode(encoding="utf-8", errors="strict") 
      print(buffer) 
     if self.wav_reader.getnchannels() != 1: # stereo audio 
      try: 
       buffer = audioop.tomono(buffer, self.wav_reader.getsampwidth(), 1, 1) # convert stereo audio data to mono 
      except Exception as e: 
       print(e) 
     return buffer

：

def read(self, size = -1): 
     buffer = self.wav_reader.readframes(self.wav_reader.getnframes() if size == -1 else size) 
     if self.wav_reader.getnchannels() != 1: # stereo audio 
      buffer = audioop.tomono(buffer, self.wav_reader.getsampwidth(), 1, 1) # convert stereo audio data to mono 
     return buffer

雖然現在不會發生錯誤，但轉錄質量卻很差。我可以非常準確地運行python -m speech_recognition，所以我不確定發生了什麼。我將energy_threshold提高到4000以確保它不是環境噪音問題。我甚至使用了2種不同的識別服務（IBM和Google語音識別）。此外，由於某種原因，最後2個緩衝區是空字符串，然後我必須轉換爲字節對象