我有一個設置了以下字段的表單:日期時間,ID和地址。這種形式自動分配每個條目的唯一ID字符串(U_ID),然後這個數據後輸出到與標題和行是這樣的一個CSV:Python - 選擇符合特定條件的所有行值一旦
Date Time ID U_ID Address
9/12/13 12:07 13 adfasd 1345 Wilson Way
9/12/13 13:45 8 jklj 1456 Jackson Hollow
9/13/13 14:55 13 klidh 1345 Wilson Way
9/13/13 15:00 8 ikodl 1456 Jackson Hollow
我正在尋找一種方法,以消除那些重複提交通過Python腳本使用相同的ID,同時保留行中的其餘數據。理想情況下,我只想保留與csv文件中的ID關聯的第一個條目。
輸出應該是這個樣子:
Date Time ID U_ID Address
9/12/13 12:07 13 adfasd 1345 Wilson Way
9/12/13 13:45 8 jklj 1456 Jackson Hollow
到目前爲止,我被困在:
import csv
with open('/Users/user/Desktop/test.csv', 'rb') as f:
r = csv.reader(f)
headers = r.next()
rows = [(Date Time, ID, U_ID, Address) for Date Time, ID, U_ID, Address in r]
clean = [row for row in rows if row[1] != '#N/A']
clean2 = list(set(row[1]))
這讓我只對ID的唯一值的列表,但我我不知道如何恢復與這些值的行相關的所有其他數據。
如前所述,如果我也能得到最早的提交,那將是美妙的,但老實說,ID的任何獨特提交都應該這樣做。
感謝您的閱讀!
工作就像一個魅力!謝謝Elyase! – roliv 2014-10-08 01:54:49