寫入詞典結果的2D矩陣到CSV文件我有字典格式化這種方式:關鍵是文件號和所述關鍵字的元組,並且該值是關鍵字的文檔中的頻率。 因此,按鍵會(文檔1,關鍵字1),(文檔1,關鍵字2),(文檔1,KEYWORD3),(文件2,關鍵字1),(文件2,關鍵字2),(文件2,KEYWORD3),(文件3,關鍵字1),(文件3,KEYWORD2)和(文件3,KEYWORD3)並將該值將是數。當然這是一本小字典。我希望該解決方案適用於大集的文件和關鍵字。概念:在Python
字典創建爲這樣:
document_count = {}
try:
for doc in document_id_list:
indiv_doc = # records selected from a database
for w in words:
document_count.setdefault((doc, w), 0)
for entry in #unsorted list of text tokenized, set to lower case, and stripped of stop words:
if entry == w and (doc, entry) in document_count:
document_count[(patent, entry)] += 1
return document_count
except Exception, e:
print "create claim storages"
print str(e)
pass
我想寫的結果到CSV像2D矩陣。至少,這是我所見過的描述。
keyword1 keyword2 keyword3
document1 number number number
document2 number number number
document3 number number number
當上python.org和其它問題,在這個網站中,CSV函數的文檔,我已經得到了最接近是這樣看:
document1 keyword1 number
document1 keyword2 number
document1 keyword3 number
document2 keyword1 number
document2 keyword2 number
document2 keyword3 number
document3 keyword1 number
document3 keyword2 number
document3 keyword3 number
這是從代碼的結果,我採寫:
with open(os.path.join('C:/Users/Tara/PyCharmProjects/untitled/csv_results/', file_name),
'wb') as csvfile:
w = csv.writer(csvfile)
for key, value in available_dict.items():
separate_keys = list(key)
w.writerow([separate_keys[0], separate_keys[1], value])
我注意到,很多解決方案都涉及列表理解,但我不知道語句應該怎樣纔是正確的。我將作出改變,當我寫一本字典,或當我寫的CSV文件?