2013-02-27 188 views
2

我試圖訂購一系列我存儲在數據框中的時間數據。格式是:如何按R數據框中的年份和月份進行排序?

"%Y-%b" 

它看起來像"2009-Sep"

直到現在我還設法找到了這種方法:

ds[order(as.Date(ds$yearmonth, format="%Y-%b")),] 

但只按年份,然後將其移至以月份的字母順序,給我的訂單2009-Jan,2009-Jul,2009-Jun等。我很困惑,這不是一個容易解決的問題。

請幫助...

最佳 卡斯帕

+1

你看着as.Date的'輸出( ds $ yearmonth,format =「%Y-%b」)'? – mnel 2013-02-27 03:22:20

+1

@mnel有你嗎?這不是有效的日期。 :-) – 2013-02-27 03:23:47

+1

@GavinSimpson,我有。我正在幫助OP澄清他的問題。 :-)。 – mnel 2013-02-27 03:24:37

回答

7

在包中的as.yearmon()功能(和"yearmon"類)動物園是專爲這類數據:

dat <- c("2009-Sep","2009-Feb","2009-Jan") 
require(zoo) 
d2 <- as.yearmon(dat, "%Y-%b") 
> sort(d2) 
[1] "Jan 2009" "Feb 2009" "Sep 2009" 
> order(d2) 
[1] 3 2 1 
> d2[order(d2)] 
[1] "Jan 2009" "Feb 2009" "Sep 2009" 

你當然可以在每個日期的每天paste0()並通過as.Date()強制到"Date"類,但as.yearmon()似乎更自然的對我說:

> as.Date(paste0(dat, "-01"), "%Y-%b-%d") 
[1] "2009-09-01" "2009-02-01" "2009-01-01" 

注意您可以通過強迫的"yearmon"對象"as.Date"類,如產生相同的結果:

> as.Date(d2) 
[1] "2009-09-01" "2009-02-01" "2009-01-01" 
+0

人們應該記住矢量類應該是「字符」。我的默認「因素」是「NA」值。 – 2013-02-27 10:46:05

+1

@KasperChristensen好點。這只是表明可重複實例的優點。從你的問題中不可能說出這些,所以我告訴你,數據是字符(這就是你展示的)。 'as.yearmon(as.character(dat),「%Y-%b」))'是解決因子問題的方法之一。另一種方法是通過指定變量類來開始以正確的格式讀取數據。通過'read.table()'及其兄弟中的'colClasses' – 2013-02-27 14:46:08