0
我有一個目錄充滿了從pcap轉換爲csv的非常大的csv文件。從pcap目錄中獲取最常見的ip到csv文件
我想遍歷該目錄中的每個csv文件並獲取最常見的源IP地址(第2列)。
目前我的輸出是不正確的,因爲它似乎已經設法讓每個文件在開始之前將其值轉儲到下一個文件中。每個文件似乎都有相同的IP,我知道情況並非如此。
ipCounter = collections.Counter()
#iterate through all of the files in the directory, using glob
for filename in glob.glob('/path/to/directory/*'):
with open(filename) as input_file:
#skip column titles
input_file.next()
for row in csv.reader(input_file, delimiter=','):
ipCounter[row[2]] += 1
print 'Source IPs most common in: %s' % filename
print ipCounter.most_common()
我不完全親與Python,所以有可能是一個更好的方式來做到這一點,但是這是我到目前爲止得到。