文本mining-如何建立一個術語文檔矩陣

我所試圖做的是加載一個CSV文件，並轉換爲長期文檔矩陣。文本mining-如何建立一個術語文檔矩陣

這裏是我的代碼部分：

myCorpus<-read.csv('alert-sample-data-4-mining.csv', head=TRUE) 
TermDocumentMatrix(myCorpus, control=list(wordLengths=c(1,Inf)))

，但得到的錯誤消息表示：錯誤UseMethod（「TermDocumentMatrix」，X）：關於「TermDocumentMatrix」不適用方法應用到的一個目的類「data.frame」

2013-12-12 Jusleong

這裏有幾件事情 - 你不加載TM庫，你沒有創建一個語料庫。嘗試這樣的事情（假設你的文本數據是在一個叫做CSV文件「文本」字段）：

library(tm) 
myCorpus <- read.csv("alert-sample-data-4-mining.csv") 
corpus <- Corpus(VectorSource(myCorpus$text)) 
TermDocumentMatrix(corpus)

2013-12-12 23:00:38 josliber

你能解釋一下「假設你的文本數據是在一個名爲場‘文本’CSV文件」，謝謝 – Jusleong

你在csv文件中有一些數據。數據的第一行是列標題的名稱，後面的所有行都是數據。某些列包含要用於構建術語文檔矩陣的文本。我假設這個列標題（也就是這個列的csv文件的第一行中的值）被稱爲「文本」。 – josliber

使用'str（myCorpus）'並查看文本列標題的名稱。 josilber說，他認爲這是爲了解釋的緣故，儘管它可能不是。 –

回答