下面的代碼產生一個簡單的比較雲:řcomparison.cloud角位置
library(tm)
library(wordcloud)
text1<- "cat cat dog dog dog bird bird bird bird bike bike bike"
text2<- "cat cat dog dog dog dog fish fish fish fish car car"
tmpText <- data.frame(c(text1, text2))
row.names(tmpText)<- c("text1", "text2")
ds <- DataframeSource(tmpText)
corp <- Corpus(ds)
corp <- tm_map(corp, PlainTextDocument)
corp <- tm_map(corp, content_transformer(tolower))
corp<- tm_map(corp, removePunctuation)
tm <- TermDocumentMatrix(corp)
tm<- as.matrix(tm)
colnames(tm) <- c("text1", "text2")
comparison.cloud(tm, , scale=c(5, 1))
我有2個問題:
1-如果兩個詞有在多個文檔中的相同頻率,如何封裝決定將其顯示在一個子雲中VS其他
2-根據文檔:「每個字...其角位置由最大發生的文檔決定。」我多次運行比較雲,沒有種子,我無法理解解釋,我做了谷歌搜索解釋,沒有發現太多,在這種情況下,「角位置」是什麼意思?
幫助是極大的讚賞
MJJ
讀取從GitHub時,#顏色=#文檔的源代碼,被預定和固定: 顏色= brewer.pal(NcoI位(term.matrix), 「深色2」) ..... 文本(X1 ,y1,words [i],cex = size [i],offset = 0,srt = rotWord * 90, col = colors [group [i]],...) #group [i]文本屬於 MJJDeveloper – MJJ