將多個值從textmining附加到python的單個列表中

我有一個csv文件，我從中導入數據。我試圖創建兩篇文章中使用的單詞列表以及它們被使用了多少次。我正在運行一個循環來獲取每個有兩篇散文的csv文件的行，並且輸出結果會在兩篇散文之間發佈組合字數。但是，我有數百行每篇都有兩篇散文。我希望所有文章中都有一個包含所有文字和單詞的列表。將多個值從textmining附加到python的單個列表中

import textmining 

import csv 

with open('2011ShortAnswers.csv', 'rb') as csvfile: 
    data = csv.reader(csvfile, delimiter=",") 

    for row in data: 
     doc1 = row[3] 
     doc2 = row[4] 

     tdm = textmining.TermDocumentMatrix() 

     tdm.add_doc(doc1) 
     tdm.add_doc(doc2) 

     for row in tdm.rows(cutoff=1): 
      print row

來源

2013-10-30 user2884824

可不可以給我們需要一個csv文件的小樣本來處理？ –

嘗試使用，你增加每個單詞的字典，當您去：

word_count_dictionary = {} 
for word in row: 
    if word not in word_count_dictionary.keys(): 
     word_count_dictionary[word] = 1 
    else: 
     word_count_dictionary[word] += 1

然後，您可以遍歷鍵，形成你需要的資源列表：

word_count_list = [(word,word_count_dictionary[word]) for word in word_count_dictionary.keys()]

來源

2013-10-30 13:23:34 Mike

將多個值從textmining附加到python的單個列表中

回答

相關問題