2011-04-18 46 views
3

我有一個文件,其中在每一行我有一個數字值象徵的平均持續時間:R + GGPLOT2 - 集合數據由區間

12.3 
5.4 
6 
... 

有R中某種方式顯示在自動或手動數據間隔/間隔(聚合?)。就像這樣:

[0,1[ 0 
[1, 6[ 1 
[6, 20[ 2 
... 

另外,接下來我想在ggplot2中產生一個顯示這些數據的圖。我可以使用這些間隔作爲標籤嗎?

回答

4

您可以在基數R中使用cut()函數對數據進行分箱或使用Hmisc軟件包和cut2()。關於如何切割和切片數據有幾種選擇,所有這些選項分別記錄在help(cut)help(cut2)中。

一旦你正確分級數據,與ggplot密謀成爲一個平凡的工作:

library(ggplot2) 
#Sample data 
set.seed(1) 
dat <- data.frame(x = sample(1:100, 1000, TRUE)) 
dat$cuts <- cut(dat$x, breaks = 5) 

#Make bar chart 
qplot(dat$cuts)