我想在Year, State, Tier, Group
分組後計算score
差異。我的數據的程式化的表述看起來像:R:由多列分組後的Dplyr滯後變量
dat2 <- data.frame(
Year = sample(1990:1996, 10, replace = TRUE),
State = sample(c("AL", "CA", "NY"), 10, replace = TRUE),
Tier = sample(1:2),
Group = sample(c("A", "B"), 10, replace = TRUE),
Score = rnorm(10))
我試圖用mutate
和group_by_
然而.dots
它獲得從下一絕對值的值(即分組似乎不工作)。我最感興趣的是繪製年度差異(ala時間序列,儘管某些年份會是NA
),所以這可以通過滯後或計算下一年的得分來解決。
編輯:因此,如果數據集的樣子:
Year State Tier Group Score
1990 AL 1 A 75
1990 AL 2 A 100
1990 AL 1 B 5
1990 AL 2 B 10
1991 AL 1 A 95
1991 AL 2 A 80
1991 AL 1 B 5
1991 AL 2 B 15
期望的最終結果將是:
Year State Tier Group Score Diff
1991 AL 1 A 95 20
1991 AL 1 B 5 0
1991 AL 2 A 80 -20
1991 AL 2 B 15 5
你能展示什麼是期望的結果嗎? –