我建議讓您熟悉plyr包。
install.packages("plyr")
它會要求你選擇一個地方下載,只需選擇最接近你的地方。然後加載庫
library(plyr)
好了,所以可以說我們有一個看起來像這樣
> df
Name Day Location
52 Jake Wed MI
25 Sally Tue NY
38 Sue Fri NY
45 Sally Tue MI
42 Sue Mon MI
17 Sally Fri CA
28 Jake Tue NY
14 Sue Thur CA
47 Jim Tue MI
67 Jim Tue AL
我們可以問每一個位置了多少次訪問數據幀
> ddply(df, .(Location), summarise, count=length(Name))
Location count
1 CA 2
2 NY 3
3 MI 4
4 AL 1
,或者有多少人們在某一天訪問了某個位置
> ddply(df, .(Location, Day), summarise, count=length(Name))
Location Day count
1 CA Thur 1
2 CA Fri 1
3 NY Tue 2
4 NY Fri 1
5 MI Mon 1
6 MI Tue 2
7 MI Wed 1
8 AL Tue 1
你應該在plyr上查看一個完整的教程,但是對於上面的命令,基本上發生的是ddply正在通過指定的列中值的唯一組合來拆分數據框,並根據函數彙總數據(在我們的案例長度),你指定。
我希望這會有所幫助。
可以使用'表()'函數來按組計數。參見'?table' – 2015-04-01 18:59:38
看看'xtabs'函數。如果使用'tapply'或'aggregate',返回計數的標準方法是使用'length'。 @hadley(和其他我認爲)已經構建了addon包的'count'函數。 – 2015-04-01 19:09:14