我有一個西班牙文檔我想用Python進行格式化。問題在於,在輸出文件中,重音字符會以這種方式混亂:\ xc3 \ xad。 當我做了一些類似的編輯時,我成功地保留了正確的字符,儘管我已經嘗試過所有我做過的事情,但是不知何故,這次它不會工作。 這是當前版本的代碼:Python:輸出中出現拉丁字符的問題
# -*- coding: utf-8 -*-
import re
import pickle
inputfile = open("input.txt").read()
pat = re.compile(r"(@.*\*)")
mylist = pat.findall(inputfile)
outputfile = open("output.txt", "w")
pickle.dump(mylist, outputfile)
outputfile.close()
我使用Python 2.7在Windows 7 任何人都可以看到任何明顯的問題?輸入文件以utf-8編碼,但我也嘗試過對latin-1進行編碼。謝謝。
澄清:我的問題是,拉丁字符不能正確顯示在輸出中。 它現在解決了,我不得不添加此行,馬塔的建議:
inputfile = inputfile.decode('utf-8')
你試過'.encode( 'UTF-8')''-ing的mylist'的元素? –
將錯誤提示給您的問題 –
爲什麼您希望'pickle.dump'輸出完全可讀? – geoffspear