2011-06-17 35 views
2

卦我有一個包含各行中的單詞列:[R產生雙邊和從

word 
----- 
asdf 
wer 
asdf 

有沒有辦法得到最頻繁的雙邊和卦所有行? 例如,對於二元語法:

aa: 10% 
ab: 9% 
..... 

回答

2

我有這個特殊這類問題沒有任何經驗,但有點谷歌的工作變成了tau包「的N-gram基於文本分類」。並使用你的樣品textcnt功能是這樣的:

x <- c('asdf','wer','asdf') 
textcnt(x,3) 

,似乎回到那種你正在尋找的信息。