0
我有一個csv文件,我從中導入數據。我試圖創建兩篇文章中使用的單詞列表以及它們被使用了多少次。我正在運行一個循環來獲取每個有兩篇散文的csv文件的行,並且輸出結果會在兩篇散文之間發佈組合字數。但是,我有數百行每篇都有兩篇散文。我希望所有文章中都有一個包含所有文字和單詞的列表。將多個值從textmining附加到python的單個列表中
import textmining
import csv
with open('2011ShortAnswers.csv', 'rb') as csvfile:
data = csv.reader(csvfile, delimiter=",")
for row in data:
doc1 = row[3]
doc2 = row[4]
tdm = textmining.TermDocumentMatrix()
tdm.add_doc(doc1)
tdm.add_doc(doc2)
for row in tdm.rows(cutoff=1):
print row
可不可以給我們需要一個csv文件的小樣本來處理? –