樣品計算年齡
df <- data.frame(
Birth_Date = c("1952-03-21", "1963-12-20", "1956-02-25", "1974-08-04", "1963-06-13", "1956-11-20", "1974-03-07", "1963-10-23", "1952-11-24", "1974-12-16"),
Items_Amount = c(68,189,69,19,299,79,149,149,29,189)
)
df
我試圖分析一個數據集,其中有跨90年列Item_Amount(以$)和客戶的出生日期蔓延。目標是比較基於適當年齡組的銷售百分比。
主要數據幀包含日期「出生日期」,從「1902年2月13日」到「1991年12月11日」的日期不是字符串列
'data.frame': 350241 obs. of 1 variable:
$ BirthDate: Date, format: "1964-06-08" "1964-06-08" "1964-06-08" "1964-06-08" ...
> min(Trans_Cust$Birth_Date)
[1] "1902-02-13"
> difftime(max(Trans_Cust$Birth_Date),min(Trans_Cust$Birth_Date),units = "auto")
Time difference of 32808 days
> max(Trans_Cust$Birth_Date)
[1] "1991-12-11"
如何找到立足現在年齡「Birth_Date」列,將其存儲到新列「Present_ages」,然後繼續計算由present_ages分組的sum(Items_Amount)
。
確保你提供了[可重現的例子](http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example )在尋求幫助的時候,這裏的期望輸出到底是什麼?這幾十年你想做什麼? – MrFlick
@MrFlick詳情添加了 –
你的mo相關問題涉及agegroup01 - agegroup09,但您對數據的描述表明您的數據跨越了10年。 – G5W