我之前問過這個問題,並得到了答覆,爲我解決了它。我有一個數據幀,看起來像這樣:得到符合特定標準的值的平均值(模式匹配)
id weekdays halflife
241732222300860000 Friday, Aug 31, 2012, 22 0.4166666667
24168917Friday, Aug 31, 2012, 19 0.3833333333
241686878137512000 Friday, Aug 31, 2012, 19 0.4
241651117396738000 Friday, Aug 31, 2012, 16 1.5666666667
241635163505820000 Friday, Aug 31, 2012, 15 0.95
241633401382265000 Friday, Aug 31, 2012, 15 2.3666666667
而且我想獲得的平均半衰期週一創建的項目,然後在週二...等。 (我的日期範圍跨越6個月)。
要獲得我使用的日期值strptime
和difftime
。此外,我發現max(df$halflife)
的最大半衰期,我怎麼能找到它對應的ID?
重複性代碼:
structure(list(id = c(241732222300860416, 24168917,
241686878137511936, 241651117396738048, 241635163505819648, 241633401382264832
), weekdays = c("Friday, Aug 31, 2012, 22", "Friday, Aug 31, 2012, 19",
"Friday, Aug 31, 2012, 19", "Friday, Aug 31, 2012, 16", "Friday, Aug 31, 2012, 15",
"Friday, Aug 31, 2012, 15"), halflife = structure(c(0.416666666666667,
0.383333333333333, 0.4, 1.56666666666667, 0.95, 2.36666666666667
), class = "difftime", units = "mins")), .Names = c("id",
"weekdays", "halflife"), row.names = c(NA, 6L), class = "data.frame")
所以,現在,我有一個平均水平的一半生命值都在星期一,星期二...等。我怎樣才能得到這些工作日內所有小時的平均值,即:所有星期一上午9點,上午10點,然後上午11點創建的所有項目的平均半衰期。然後週二早上9點,上午10點,上午11點..等等。星期幾列中的日期格式化,以便逗號後面的最後一個數字是它創建時的小時數。我對正則表達式和模式匹配非常不滿,這就是爲什麼我要問這個後續問題。