2017-09-02 59 views
0

我有如下數據集:在所有數據集的最頻繁出現的詞彙

interests<-data.frame(interests=c("A mentor/teacher,Friendship", 
         "A play partner,Princess by day slut by night,Friendship,A sub,A slave", 
         "A relationship,A play partner,Friendship,Events", 
         "Not Defined")) 

所以數據集如下:

interests 
<fctr> 
A mentor/teacher,Friendship 
A play partner,Princess by day slut by night,Friendship,A sub,A slave 
A relationship,A play partner,Friendship,Events 
Not Defined 

我需要知道,多少次每學期在數據集中重複?

例如在「友誼」已經重複倍,但「一齣戲的合作伙伴」已經reapeated 倍,其餘的都重複一次。

我已經看到類似的問題,如this,但問題是條款的長度是不同的。

回答

3
table(unlist(strsplit(as.character(interests$interests), split="\\W"))) 

,或者因爲你似乎認爲 「一齣戲的合作伙伴」 一個詞:

table(unlist(strsplit(as.character(interests$interests), split=","))) 
相關問題