我有許多關於諾貝爾獎的條目。我比文件轉換成像這樣的列表:python中的特殊字符
file = open(path, 'r')
file.readline()
content = []
for line in file:
line = line.replace('\n', '')
content.append(line.split(';'))
content = check(content, 'röntgen')
之後,我有一個函數,該列表和其他參數,並檢查該列表中包含這樣的說法。但是,如果該參數可喜歡它doen't工作Ö特殊字符,因爲當文件被讀蟒蛇保存它想:ö
def check(content, attr):
reducedList = []
for i in range(len(content)):
curr = content[i][4]
if curr.find(attr) != -1:
reducedList.append(content[i])
return reducedList
有:
curr = 'voor hun verdiensten op het gebied van de analyse van de kristalstructuur door middel van röntgenstraling'
attr = 'röntgen'
我試圖將其轉換與UTF-8,但似乎沒有幫助。有沒有人有辦法解決嗎?
嘗試使用iso-8859-1編碼 – Chedy2149
您的Python文件和您的文本文件是否都使用UTF-8編碼? – Guillaume
python文件編碼爲# - \ * - 編碼:utf-8 - \ * - 和文本文件編碼爲utf-8 –