2013-12-12 112 views
1

我所試圖做的是加載一個CSV文件,並轉換爲長期文檔矩陣。文本mining-如何建立一個術語文檔矩陣

這裏是我的代碼部分:

myCorpus<-read.csv('alert-sample-data-4-mining.csv', head=TRUE) 
TermDocumentMatrix(myCorpus, control=list(wordLengths=c(1,Inf))) 

,但得到的錯誤消息表示:錯誤UseMethod(「TermDocumentMatrix」,X): 關於「TermDocumentMatrix」不適用方法應用到的一個目的類「data.frame」

回答

2

這裏有幾件事情 - 你不加載TM庫,你沒有創建一個語料庫。嘗試這樣的事情(假設你的文本數據是在一個叫做CSV文件「文本」字段):

library(tm) 
myCorpus <- read.csv("alert-sample-data-4-mining.csv") 
corpus <- Corpus(VectorSource(myCorpus$text)) 
TermDocumentMatrix(corpus) 
+0

你能解釋一下「假設你的文本數據是在一個名爲場‘文本’CSV文件」 ,謝謝 – Jusleong

+0

你在csv文件中有一些數據。數據的第一行是列標題的名稱,後面的所有行都是數據。某些列包含要用於構建術語文檔矩陣的文本。我假設這個列標題(也就是這個列的csv文件的第一行中的值)被稱爲「文本」。 – josliber

+0

使用'str(myCorpus)'並查看文本列標題的名稱。 josilber說,他認爲這是爲了解釋的緣故,儘管它可能不是。 –

相關問題