計算CSV列中出現的單詞並寫入另一個CSV？

我一直致力於開發一個程序來打開一個CSV文件，計算單詞「Info」，「Low」，「Medium」，「High」和「Critical」出現的次數，並將結果寫入到另一個CSV。順着這條道路，我希望它能夠解析多個CSV格式的信息，並將所有結果寫入一個CSV。這是我到目前爲止有：計算CSV列中出現的單詞並寫入另一個CSV？

import sys 
import csv 
import collections 

severity = collections.Counter() 
with open(r'C:\Report.csv', 'r') as f: 
    reader = csv.reader(f) 
    for row in reader: 
     severity[row[3]] +=1 

print(severity.most_common) 
with open(r'C:\test.csv', 'a', newline='') as write_file: 
    sevwrite = csv.writer(write_file, delimiter= ',', 
         quotechar=' ', quoting=csv.QUOTE_MINIMAL) 
    sevwrite.writerow([severity.most_common])

它寫出完整

<bound method Counter.most_common of Counter({'Info': 510, 'Medium': 30, 'Low': 24, 'High': 7, 'Severity': 1})>

到Test.CSV文件。任何幫助表示讚賞。

來源

2014-02-17 RonTheBear

您需要呼叫的most_common方法：

print(severity.most_common())

和

sevwrite.writerow(severity.most_common())

這不太寫出你想要的東西無論是作爲.most_common()方法返回一個元組列表;每個元組都有一個鍵和相應的計數。其結果是，上述sevwrite.writerow()調用（沒有列表字面[...]）會寫：

('Info', 510),('Medium', 30),('Low', 24),('High', 7),('Severity', 1)

到文件中。由於.most_common()按排序順序（從最高到最低）返回此列表，因此不同的輸入CSV最有可能導致不同的嚴重性排序。

如果輸出CSV文件中的每一行都包含計數，您可能希望將列保持相同的一致順序。您也不需要包含嚴重性密鑰;這可能是CSV文件頭的一部分。

我會使用一個csv.DictWriter()這裏來代替：

with open(r'C:\test.csv', 'a', newline='') as write_file: 
    sevwrite = csv.DictWriter(write_file, ('High', 'Severity', 'Medium', 'Info', 'Low')) 
    sevwrite.writerow(severity)

每次

現在只有計數將每個鍵被寫入，在同一列。 csv.DictWriter()的第二個參數設置值將寫入列的順序。

請注意，您可以簡化閱讀這裏太：

import csv 

from collections import Counter 

with open(r'C:\Report.csv', 'r') as f: 
    reader = csv.reader(f) 
    severities = Counter(r[3] for r in reader)

是所有你需要在這裏建立了Counter對象。

現在，輸入文件的系列做到這一點，你可以使用：

import csv 

from collections import Counter 

with open(r'C:\test.csv', 'w', newline='') as write_file: 
    sevwrite = csv.DictWriter(write_file, ('High', 'Severity', 'Medium', 'Info', 'Low')) 
    sevwrite.writeheader() 

    for filename in list_of_filenames: 
     with open(r'C:\Report.csv', 'r') as f: 
      reader = csv.reader(f) 
      severities = Counter(r[3] for r in reader) 
      sevwrite.writerow(severities)

這裏輸出的文件被打開寫（未追加）;這使我們有機會在頂部添加標題行sevwrite.writeheader()。

來源

2014-02-17 19:05:53

擺脫Counter循環的一個好方法是：'severity.update（cvs.reader（f）中行的行[3]）''。使用帶標題鍵的DictReader而不是硬編碼的'3'索引也許更好。 –

@DaneWhite：在那裏*是一個標題行。硬編碼'3'與硬編碼字典密鑰沒什麼兩樣。 –

@Martjin：是的，只要有一個標題行。但是，對列順序的代碼依賴性與對數據標籤的依賴性有很大不同。區別與實現依賴關係和接口依賴關係相同。 –

計算CSV列中出現的單詞並寫入另一個CSV？

回答

相關問題