試圖將此數據框轉換爲比率矩陣,使2007年1月的A列等於2007年1月/ 2007年平均值,2007年2月將等於4/2007年平均值......需要應用於所有列。比率月份與年度平均值
YearM A B C
2007/Jan 3 5 7
2007/Feb 4 5 6
2007/Mar 4 4 2
...........
2013/Dec 4 4 2
試圖將此數據框轉換爲比率矩陣,使2007年1月的A列等於2007年1月/ 2007年平均值,2007年2月將等於4/2007年平均值......需要應用於所有列。比率月份與年度平均值
YearM A B C
2007/Jan 3 5 7
2007/Feb 4 5 6
2007/Mar 4 4 2
...........
2013/Dec 4 4 2
library(dplyr)
avg_mat = df %>%
group_by(year = sub("/.*", "", YearM)) %>%
mutate_at(vars(A:C), "mean") %>%
ungroup() %>%
select(A:C) %>%
as.matrix()
mat = df %>%
select(A:C) %>%
as.matrix()
cbind(YearM = df$YearM, as.data.frame(mat/avg_mat))
結果:
YearM A B C
1 2007/Jan 0.8181818 1.0714286 1.4
2 2007/Feb 1.0909091 1.0714286 1.2
3 2007/Mar 1.0909091 0.8571429 0.4
4 2013/Dec 1.0000000 1.0000000 1.0
數據:
df = read.table(text = "YearM A B C
2007/Jan 3 5 7
2007/Feb 4 5 6
2007/Mar 4 4 2
2013/Dec 4 4 2", header = TRUE)
下面是一個使用sapply
和ave
功能的另一種方式。 ave
部分是從this post借來的。
df$year <- year = sub("/.*", "", df$YearM)
df[,c('A','B','C')] <- df[,c('A','B','C')]/sapply(df[,c('A','B','C')], ave, df$year)
YearM A B C year
1 2007/Jan 0.8181818 1.0714286 1.4 2007
2 2007/Feb 1.0909091 1.0714286 1.2 2007
3 2007/Mar 1.0909091 0.8571429 0.4 2007
4 2013/Dec 1.0000000 1.0000000 1.0 2013
您可以使用'dput'發佈您的數據樣本嗎?您現在插入的樣本很難與 – bouncyball
一起工作,只是想出瞭如何使用dput。 – jkl
請不要忘記接受您發現最有用的答案,方法是點擊downvote按鈕 – useR