我試圖加載一個文本文件,其中包含與Python的讀取非ASCII文本文件
content=open("file.txt","r").read()
導致此錯誤消息德國的一些信件
UnicodeDecodeError: 'ascii' codec can't decode byte 0xc3 in position 26: ordinal not in range(128)
如果我修改該文件只包含ASCII字符一切都按預期工作。
Apperently使用
content=open("file.txt","rb").read()
或
content=open("file.txt","r",encoding="utf-8").read()
都做的工作。
爲什麼使用「二進制」模式讀取並獲得與utf-8編碼相同的結果?
好吧,我看到'型(開放式(ULF_DIR +「Banken銀行。 ())「返回」字節「和」類型「(open(ULF_DIR +」Banken.txt「,」r「,encoding =」utf-8「)。read())'返回str 。我將輸出寫入另一個文件並且感到困惑,因爲生成的文件在兩種方法上看起來都一樣,而且在輸入數據後我忽略了不同的類型。 –