2014-05-05 97 views
0

代碼可以在這裏下載: https://github.com/kelrien/pyretrieval/編碼錯誤

每當我執行我的example.py,以下錯誤彈出:

Traceback (most recent call last): 
    File "<stdin>", line 1, in <module> 
    File "example.py", line 21, in <module> 
    docs.append(proc.process(line.decode("utf-8"))) 
    File "pyretrieval\processor.py", line 61, in process 
    tokens = self.tokenize(string) 
    File "pyretrieval\processor.py", line 47, in tokenize 
    temp = temp.replace(char, self.replace_characters[char]) 
UnicodeDecodeError: 'ascii' codec can't decode byte 0xfc in position 0: ordinal not in range(128) 

正如你所看到的 - 嘗試替換我指定的德語元音變音時發生錯誤。如果我不使用replace_characters字典並忽略這些變音符號,我沒有收到錯誤。

我已經嘗試了很多東西:

  • 使用的編解碼器模塊
  • 使用編碼( 「UTF-8」)和解碼( 「UTF-8」)在不同

回答