2016-09-26 41 views
0

您好,有一個問題,March在我的圖中出現了兩次,但在我的數據中沒有出現。使用ggplot2月份顯示不正確

我的數據看起來像。我的數據框叫做try1。

Month     Year tcol 
    2016-01-01 00:00:00 06  1461.0 
    2016-02-01 00:00:00 06  259.5 
    2016-03-01 00:00:00 06  191.2 
    2016-04-01 01:00:00 06  151.5 
    2016-05-01 01:00:00 06  119.6 
    2016-06-01 01:00:00 06  1372.5 
    2016-07-01 01:00:00 06  954.0 
    2016-08-01 01:00:00 06  1784.0 
    2016-09-01 01:00:00 06  1369.0 
    2016-10-01 01:00:00 06  6077.0 
    2016-11-01 00:00:00 06  1638.0 
    2016-12-01 00:00:00 06  3308.0 

而我的代碼看起來像。

ggplot(try1, aes(Month,tcol)) + 
     geom_point(aes(colour = Year),size=2) + 
     geom_line(aes(colour = Year), size=0.73)+ 
     theme_bw()+ 
     guides(col = guide_legend(ncol = 2))+ 
     scale_x_datetime(
         breaks=date_breaks("1 months"), 
         labels=date_format("%B"))+ 
     xlab("")+ #x axis label 
     ylab("Total Coliforms") 

問題是,當我繪製我的圖形三月出現兩次。十月似乎被排除在外。

The resulting graph

感謝您的幫助。

+0

什麼數據類型是Month列?因素還是約會? – Wietze314

+0

我無法重現該問題。你可以運行'dput(try1)'並將結果複製到你的問題中。那我們將使用相同類別的對象。 – Benjamin

+0

@ 9Heads,您的月份標籤已關閉1個月;他們從十二月開始到十一月結束)。不太清楚你是如何做到的。 :) – Benjamin

回答

1

我懷疑這是一個時區問題。例如,用這個數據

structure(list(Month = structure(list(sec = c(0, 0, 0, 0, 0, 
0, 0, 0, 0, 0, 0, 0), min = c(0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 
0L, 0L, 0L, 0L), hour = c(0L, 0L, 0L, 1L, 1L, 1L, 1L, 1L, 1L, 
1L, 0L, 0L), mday = c(1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 
1L, 1L), mon = 0:11, year = c(116L, 116L, 116L, 116L, 116L, 116L, 
116L, 116L, 116L, 116L, 116L, 116L), wday = c(5L, 1L, 2L, 5L, 
0L, 3L, 5L, 1L, 4L, 6L, 2L, 4L), yday = c(0L, 31L, 60L, 91L, 
121L, 152L, 182L, 213L, 244L, 274L, 305L, 335L), isdst = c(0L, 
0L, 0L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 0L, 0L), zone = c("GMT", 
"GMT", "GMT", "BST", "BST", "BST", "BST", "BST", "BST", "BST", 
"GMT", "GMT"), gmtoff = c(NA_integer_, NA_integer_, NA_integer_, 
NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
NA_integer_, NA_integer_, NA_integer_, NA_integer_)), .Names = c("sec", 
"min", "hour", "mday", "mon", "year", "wday", "yday", "isdst", 
"zone", "gmtoff"), class = c("POSIXlt", "POSIXt"), tzone = c("Europe/London", 
"GMT", "BST")), Year = c(6L, 6L, 6L, 6L, 6L, 6L, 6L, 6L, 6L, 
6L, 6L, 6L), tcol = c(1461, 259.5, 191.2, 151.5, 119.6, 1372.5, 
954, 1784, 1369, 6077, 1638, 3308)), .Names = c("Month", "Year", 
"tcol"), row.names = c(NA, -12L), class = "data.frame") 

我可以重現你的圖表。嘗試改變時區

attr(try1$Month, "tzone") <- "UTC" 

和replot。


更新。我想知道爲什麼要將時區更改爲「UTC」。事實證明,date_format()需要一個默認爲「UTC」的參數tz。請參閱?date_format。這意味着您可以通過將date_format()中的參數tz更改爲Month的原始時區,而不是將Month的時區更改爲「UTC」,而不必修改您的問題,您可以通過attr(try1$Month, "tzone")進行檢查。

+0

這確實是一個時區問題。我用我的系統時區繪製了上面的數據並獲得了正確的圖表。 [情節鏈接](http://i.stack.imgur.com/tHvKD.png) – 9Heads