allWords
是一個130萬字的矢量,有一些重複。我想要做的,是創建兩個載體:R永遠需要計算一個簡單的程序
一個字
B帶字的次數
所以,我可以在以後加入他們在一個矩陣,從而關聯他們,像:「媽媽」,3; 「鉛筆」,14等
for(word in allWords){
#get a vector with indexes for all repetitions of a word
temp <- which(allWords==word)
#Make "allWords" smaller - remove duplicates
allWords= allWords[-which(allWords==word)]
#Calculate occurance
occ<-length(temp)
#store
A = c(A,word)
B = c(B,occ)
}
這for循環需要永遠,我真的不知道爲什麼或我做錯了什麼。從文件中讀取130萬字最多隻需5秒,但執行這些基本操作決不會讓算法終止。
您在[將R地獄]的圈2(http://www.burns-stat.com/pages/Tutor/R_inferno.pdf) – GSee
有人應該得到這是一個更好的標題......也許是「縮短和增加循環中的對象」 – Frank