我有一個巨大的CSV,其中每行都有一個用戶ID。我想要找到在整個集合中最頻繁出現的用戶ID。從CSV文件中找到列中最常見的記錄
我使用csv
模塊中的DictReader
來讀取csv,因爲我認爲這對稍後處理單個記錄非常有用。
我無法找到一種方法來搜索我創建的字典中鍵「UserID」的各種值並查找最常用的值。
任何幫助將不勝感激!
這是到目前爲止我的代碼:
import csv
from time import time
start = time()
myData=open("myCSV.csv", "rb")
csvReader= csv.DictReader(myData)
# declare counters
volume = 0
#sum all data usage
for data in csvReader:
volume += float(data["volume_total"])
print "Total : %f" %volume
#calculate processing time
elapsed = time() - start
print "Processing time: %f seconds" %elapsed
你是如何存儲來自'DictReader'的對象?例如,如果您將它們存儲在列表中,是否嘗試過打印該列表的第一個元素? –
嗨@JonClements。我是Python的新手,所以我不確定你的意思。據我瞭解,來自'DictReader'的對象被存儲爲(鍵,值)對,而不是列表...?我誤解了嗎? – SK10