我有一個腳本,它將銷售值寫入文件中的單獨行,最終目標是將數據保存到數據庫中。我遇到的問題是,對於同一銷售人員,日期,產品,價格和數量有重複的條目。查找重複項,添加到變量並刪除
我的代碼是這樣寫的文件:
John 07-15-2016 Tool Belt $100 2
Sara 07-15-2016 Hammer $100 3
John 07-15-2016 Tool Belt $100 2
John 07-15-2016 Tool Belt $100 2
Sara 07-15-2016 Hammer $100 3
如何刪除重複項,並添加在一起?即輸出爲:
John 07-15-2016 Tool Belt $100 6
Sara 07-15-2016 Hammer $100 6
我用計數器,但它不趕多個實例,我也不能找到一種方法,添加兩個在一起。
任何幫助,將不勝感激。
腳本:
for line in s:
var = re.compile(r'(\$)',re.M)
line = re.sub(var, "", line)
var = re.compile(r'(\,)',re.M)
line = re.sub(var, "", line)
line = line.rstrip('\n')
line = line.split("|")
if line[0] != '':
salesperson = str(salesperson)
date = dt.now()
t = line[0].split()
print t
t = str(t[0])
try:
s = dt.strptime(t, "%H:%M:%S")
except:
s = dt.strptime(t, "%H:%M")
s = s.time()
date = dt.combine(date, s)
date = str(date)
price = line[1]
quantity = line[2]
fn.write("%s %s %s %s \n" % (salesperson, date, price, quantity))
fn.close()
你是怎麼寫這個文件的?顯示您的腳本的相關部分 – Gocht
@Gocht我編輯它以顯示腳本 – Dorian
您可以創建一個字典,以便在讀取文件時跟蹤值,並且只有在完成處理數據後才寫入。一路書寫不允許你有效地回溯。 – Hobbes