我使用R中的tm
包創建文本文檔的語料庫,我想創建一個用於分類的rpart
決策樹。然而,我在互聯網上找不到任何關於rpart
使用文本數據的例子。它甚至有可能或者我可以使用其他軟件包嗎?在R中使用tm和rpart:文本數據的決策樹?
0
A
回答
1
這裏有一個首發:
library(tm)
library(rpart)
docs <- c(txt1="Hello world", txt2="lorem ipsum")
dtm <- DocumentTermMatrix(Corpus(VectorSource(docs)), control = list(weight = weightBin))
m <- as.matrix(dtm)
train <- as.data.frame(m)
train$Docs <- factor(rownames(m), labels=names(docs))
fit <- rpart(Docs~.,data=train, control = rpart.control(minsplit=1))
test <- data.frame(hello=c(1,0),world=c(0,0),ipsum=c(0,1),lorem=c(0,0), row.names=letters[1:2])
predict(fit, newdata=test, type="class")
# a b
# txt1 txt2
# Levels: txt1 txt2
相關問題
- 1. 如何在決策樹中使用rpart決定'minsplit'?
- 2. 用r在r上繪製決策樹
- 3. 如何獲得RPART中決策樹的一個終端節點中的數據
- 4. R中決策樹的參數
- 5. 如何處理'rpart'中的連續和離散變量 - 使用R的決策樹?
- 6. 決策樹在樹決策中保持使用Y變量
- 7. 如何根據R中的決策樹模型測試數據?
- 8. 在R(插圖)中繪製決策樹
- 9. 如何在R中做決策樹?
- 10. 如何使用CSV文件中的數據集決策樹?
- 11. R中的決策樹公式
- 12. R-從特定分支中提取數據的決策樹
- 13. 使用決策樹的熵
- 14. 從文本文件寫入決策樹
- 15. R:應用軟件rpart迴歸樹結果到其它數據
- 16. Anova樹和Class rpart
- 17. ID3決策樹使用web2py
- 18. 打印決策樹和feature_importance使用BaggingClassifier
- 19. R:繪製決策樹標籤離開文本切斷
- 20. 使用tf-idf時使用R和tm的新數據
- 21. 使用R中rpart生成的樹來分類新觀察值
- 22. 決策樹樣本中標記數據的權重
- 23. pyspark決策樹中的樣本權重
- 24. 在R的大數據中使用tm的語料庫功能
- 25. 決策樹中的決策節點和機會節點定義
- 26. 如何在R編程中的決策樹中指定分割?
- 27. 由Weka在決策樹中運行R中的統計測試
- 28. J48決策樹
- 29. 決策樹jQuery
- 30. 從數據創建決策樹
你在哪裏看?應該有[幾個例子](https://www.google.com/search?q=「DocumentTermMatrix」+「rpart」) – lukeA