如何根據時間序列數據計算年平均值

-1

我在計算數據的年平均值時遇到了一個問題。這裏是我的數據（dt.select）：如何根據時間序列數據計算年平均值

head(dt.select)  

     DATE  SITE_ID TSO4 TNO3 TNH4 NSO4 
61372 2000-01-07 ALH157 1.9873 3.3794 1.5214 0.2743 
61369 2000-01-14 ALH157 1.9451 4.3169 1.4218 0.9190 
61376 2000-01-21 ALH157 2.9216 4.7621 2.2883 1.1009 
61371 2000-01-28 ALH157 2.9312 5.5041 2.4494 1.9243 
67249 2000-02-04 ALH157 3.1832 7.7116 3.1407 0.9057 
67244 2000-02-11 ALH157 5.1027 9.7623 4.6308 0.3478 

tail(dt.select) 

     DATE  SITE_ID TSO4 TNO3 TNH4 NSO4 
49342 2015-11-27 ALH157 1.1826 1.8821 0.7209 0.6908 
55291 2015-12-04 ALH157 1.5332 3.9142 1.6252 0.7613 
55292 2015-12-11 ALH157 1.5277 1.0478 0.5452 0.6588 
55293 2015-12-18 ALH157 0.9947 1.0137 0.4906 0.5088 
55294 2015-12-25 ALH157 0.7792 0.6357 0.4327 0.5266 
55260 2016-01-01 ALH157 1.4620 1.7782 0.9438 0.4873

這是近15年的數據。現在，我使用下面的代碼來獲得年平均值。

Annual.Ave <- aggregate(dt.select[-2], format(dt.select[1],"%Y"), 
         mean, na.rm = TRUE)

的結果是什麼樣的，我想，但「SITE_ID」的列被刪除，還有，我不需要進行隨機「日期」一欄。

head(Annual.Ave) 
    DATE DATE  TSO4  TNO3  TNH4 
1 2000 2000-07-03 4.250796 2.943349 2.057633 
2 2001 2001-07-02 3.986159 2.896429 1.949810 
3 2002 2002-07-01 4.483027 2.600660 1.985302 
4 2003 2003-06-30 3.831227 2.493104 1.786642 
5 2004 2004-07-02 3.375330 2.319875 1.556811 
6 2005 2005-07-04 4.785614 2.399269 2.089143

您知道如何修復代碼以獲得如下結果嗎？

DATE SITE_ID TSO4 TNO3 TNH4 NSO4 
1 2000 ALH157 4.250796 2.943349 2.057633

來源

2016-04-14 Lee Yee

既然您想要SITE_ID列，您是否試圖獲得每個工作站*的TS/TN/NS列*年平均值？ –

嗨，這是僅來自一個網站（ALH157）的數據。但我想保留這一欄。 –

但是，如果您在一個數據框中有多個SITE_ID，那麼該列應該顯示什麼，因爲它是聚合在所有SITE_ID上的？（這就是爲什麼它被丟棄的原因，保留它是沒有意義的，除非你想要每個SITE_ID的總數，或者你保證每個數據幀只有一個SITE_ID） –

這將讓你一期列意味着你的數據，對各年，然後離開Site_Id。

library("plyr") 
dates<- format(as.Date(dt.select$DATE), format = "%Y") 
# Column wise 
ddply(dt.select, .(SITE_ID, dates), summarise, 
     mean_TSO4 = mean(TSO4), 
     mean_TNO3 = mean(TNO3), 
     mean_TNH4 = mean(TNH4), 
     mean_NSO4 = mean(NSO4))

輸出

SITE_ID dates mean_TSO4 mean_TNO3 mean_TNH4 mean_NSO4 
1 ALH157 2000 3.01185 5.906067 2.57540 0.91200 
2 ALH157 2015 1.20348 1.698700 0.76292 0.62926 
3 ALH157 2016 1.46200 1.778200 0.94380 0.48730

我希望它能幫助。您可以通過此瞭解更多plyr package

來源

2016-04-15 16:59:24 user5249203

這裏是一條路可走：

# create year variable 
dt.select$year <- format(dt.select[1],"%Y") 
# aggregate 
Annual.Ave <- aggregate(dt.select[-c(1,2)], df[c("SITE_ID", "year")], 
        mean, na.rm = TRUE)

或以下@ 42的建議，

# create year variable 
dt.select$year <- format(dt.select[1],"%Y") 
# aggregate 
Annual.Ave <- aggregate(dt.select[-c(1,2)], df["year"], 
        mean, na.rm = TRUE) 
Annual.Ave$site <- "ALH157"

來源

2016-04-15 00:51:04 lmo

非常感謝@lmo，通過運行代碼'Error：unexpected'，'in Annual.Ave < - aggregate（dt.select [ - （1，'' –

太棒了！謝謝！ –

如何根據時間序列數據計算年平均值

回答

相關問題