2015-05-22 12 views
0
#Loading Packages 

library(tm) 
library(wordcloud) 

library(RColorBrewer) 

speech="/Users/GregDuncan/Desktop/bills.txt" 
modi_txt = readLines(speech) 


modi<-Corpus(VectorSource(modi_txt)) 


modi_data<-tm_map(modi,stripWhitespace) 

modi_data<-tm_map(modi_data,tolower) 

modi_data<-tm_map(modi_data,removeNumbers) 

modi_data<-tm_map(modi_data,removePunctuation) 

modi_data<-tm_map(modi_data,removeWords, stopwords(「english」)) 


tdm_modi<-TermDocumentMatrix (modi_data) #Creates a TDM 

TDM1<-as.matrix(tdm_modi) #Convert this into a matrix format 

v = sort(rowSums(TDM1), decreasing = TRUE) #Gives you the frequencies for every word 

Summary(v) 



wordcloud (modi_data, scale=c(5,0.5), max.words=1, random.order=FALSE, rot.per=0.35, use.r.layout=FALSE, colors=brewer.pal(8, 「Dark2″)) 

所以我試圖讓一個文字的文字雲。我試圖用RSCRIPT運行它,我碰到一個問題,像這樣的在R中製作一個簡單的wordcloud

enter Error: unexpected input in "modi_data<-tm_map(modi_data,removeWords, stopwords(?" 
Execution haltedcode here 

unexpected input in "wordcloud (modi_data, scale=c(5,0.5), max.words=1, random.order=FALSE, rot.per=0.35, use.r.layout=FALSE, colors=brewer.pal(8, �" 

我是很新,R,所以我想只是學習基本。我不知道是否有更多經驗的人可以快速看到問題

+0

它必須爲「英語」引發錯誤,您需要確保其正確提及。刪除引號並重新輸入。 – KRU

回答

0

請注意下面的更改,它應該運行。我使用了tm包中的數據集crude

library(tm) 
library(wordcloud) 

library(RColorBrewer) 

data(crude) 
modi_txt <- crude 

modi<-Corpus(VectorSource(modi_txt)) 


modi_data<-tm_map(modi,stripWhitespace) 

modi_data<-tm_map(modi_data,tolower) 

modi_data<-tm_map(modi_data,removeNumbers) 

modi_data<-tm_map(modi_data,removePunctuation) 

modi_data<-tm_map(modi_data, removeWords, stopwords("english")) # NB quote marks were wrong. This can happen if you copied from Word, for example 

modi_data<-tm_map(modi_data, PlainTextDocument) # NB: added this call 

tdm_modi<-TermDocumentMatrix (modi_data) 

TDM1<-as.matrix(tdm_modi) 

v = sort(rowSums(TDM1), decreasing = TRUE) 

summary(v) # NB need lower case "s" 

wordcloud (modi_data, scale=c(5,0.5), max.words=1, random.order=FALSE, rot.per=0.35, 
      use.r.layout=FALSE, colors=brewer.pal(8, "Dark2")) # NB had to fix quotes for "D... 

結果在這裏很奇怪,但您可能想要試驗wordcloud參數。

enter image description here

+0

我在一個bills.txt中獲得了所有文本 如何將我的文本放入此粗略對象中?你似乎只是做了它 – Eigenvalue

+0

你有沒有嘗試像modi_txt < - 掃描(「/用戶/ GregDuncan /桌面/ bills.txt」,什麼=「字符」)?然後繼續。我使用了數據集來演示,因爲您沒有提供任何文本。如果在控制檯或命令行中輸入dput(modi_txt),然後將結果剪切並粘貼到問題中,其他人可以重現您的實際文本。 – lawyeR