2013-11-21 60 views
2

我能夠製作單詞雲,但是我的問題是當我記錄單詞數量的頻率時,我得到的單詞頻率是1.我想要單詞的頻率大於2。我可以這樣做嗎?從R中的文字雲中刪除單詞

tdm只是一個術語矩陣。我試過的東西像rowSums(m>2),但其沒有工作

# define tdm as matrix 
m = as.matrix(tdm) 
# get word counts in decreasing order 
word_freqs = sort(rowSums(m), decreasing=TRUE) 
# create a data frame with words and their frequencies 
dm = data.frame(word=names(word_freqs), freq=word_freqs) 

試圖從https://sites.google.com/site/miningtwitter/questions/talking-about/wordclouds/wordcloud1

+1

這裏看看: http://groupspaces.com/KCRUsersGroup/wiki/wordcloud –

回答

2

,使你可以簡單地過濾word_freqs構建data.frame前:

word_freqs <- word_freqs[word_freqs > 2] 
+0

太棒了..感謝.. @ Manetheran..can你告訴我一件事,如果我只想要前兩個單詞,那我該如何計算它? –

+1

既然你已經有了降序排序的單詞,你可以只用前兩個元素:'word_freqs < - word_freqs [1:2]'。 –

+0

甚至只是'dm [1:2,]' –