我想通過特定的字符串拆分數據框中的一些數據並計算出頻率。使用stringi和rbind的R lapply
玩了幾個方法後,我想出了一個方法,但是在我的結果中有一個小小的錯誤。
實施例:
數據的幀數據的文件:
data
abc hello
hello
aaa
zxy
xyz
列表:
list
abc
bcd
efg
aaa
我的代碼:
lapply(list$list, function(x){
t <- data.frame(words = stri_extract(df$data, coll=x))
t<- setDT(t)[, .(Count = .N), by = words]
t<-t[complete.cases(t$words)]
result<-rbind(result,t)
write.csv(result, "new.csv", row.names = F)
})
在這個例子中我期望一個CSV音響樂結果如下:
words Count
abc 1
aaa 1
但是我的代碼我得到:
words Count
aaa 1
我知道stri_extract
應確定內abc hello
abc
所以也許錯誤發生時,我使用rbind
?
參見:'stringi :: stri_list2matrix' – gagolews