我從3個大數據表(名爲A1,A2,A3)開始。每個表都有4個數據列(V1-V4),1個「日期」列,在所有三個表和數千行中保持不變。根據(部分)匹配的列名計算行平均值
下面是一些近似於我的表的虛擬數據。
A1.V1<-c(1,2,3,4)
A1.V2<-c(2,4,6,8)
A1.V3<-c(1,3,5,7)
A1.V4<-c(1,2,3,4)
A2.V1<-c(1,2,3,4)
A2.V2<-c(2,4,6,8)
A2.V3<-c(1,3,5,7)
A2.V4<-c(1,2,3,4)
A3.V1<-c(1,2,3,4)
A3.V2<-c(2,4,6,8)
A3.V3<-c(1,3,5,7)
A3.V4<-c(1,2,3,4)
Date<-c(2001,2002,2003,2004)
DF<-data.frame(Date, A1.V1,A1.V2,A1.V3,A1.V4,A2.V1,A2.V2,A2.V3,A2.V4,A3.V1,A3.V2,A3.V3,A3.V4)
因此,這是我的數據幀結束看起來像:
Date A1.V1 A1.V2 A1.V3 A1.V4 A2.V1 A2.V2 A2.V3 A2.V4 A3.V1 A3.V2 A3.V3 A3.V4
1 2001 1 2 1 1 1 2 1 1 1 2 1 1
2 2002 2 4 3 2 2 4 3 2 2 4 3 2
3 2003 3 6 5 3 3 6 5 3 3 6 5 3
4 2004 4 8 7 4 4 8 7 4 4 8 7 4
我的目標是計算該行的意思是每個從各個數據表的匹配列。所以在這個例子中,我希望所有列以V1結尾,所有列以V2結尾,所有列以V3結尾,所有列以V4結尾。
最終的結果是這樣的
V1 V2 V3 V4
2001 1 2 1 1
2002 2 4 3 2
2003 3 6 5 3
2004 4 8 7 4
所以我的問題是,如何我去計算行基於列名部分匹配意味着什麼?
感謝
我們可以假設我們可以不依賴於列的位置排序?即「匹配」列可能是不規則間隔的? – joran
不,我們不能依賴位置排序。而我正在使用的實際數據集有更多的列,所以指定列定位將是一個麻煩 – Vinterwoo