我有一個文件,下面是它的外觀片段。我有這些關聯的分數的話。我怎樣才能刪除有較低分數的副本。我的意思是'新鮮'有兩個分數(7.781和5.750),我試圖用較低的分數去除'新鮮'和其他重複的詞條。這可能嗎?如何從文本文件中刪除重複條目?
['norwegian', 7.781341354126479]
['rp', 7.7802465301013]
['fresh', 7.7721646246757885]
['tick', 7.7721646246757885]
['wood', 7.7721646246757885]
['fresh', 5.750711529372451]
['tick', 4.750711529372451]
我已經嘗試做以下操作,將文件放到字典中,並將單詞和分數分開。
from collections import defaultdict
d={}
last_seen=set()
with open("scored.txt","r") as filer:
for line in filer:
term, score= line.strip().split(",",1)
if line not in last_seen:
last_seen.add(line)
你的代碼在哪裏? – Vader
你的文件是否包含括號和逗號?另外,請發佈您嘗試過的代碼。 – mhawke
已添加。是的,該文件與上面顯示的格式完全相同。 – minks