2017-02-21 210 views
1

我有兩個數據幀,其中兩個數據幀都有一個公共列。其中一個數據框有一個額外的行。合併兩個數據幀,其中一個數據幀包含額外的行

> df1 
       type  x   y 
1     A  10   417 
2     B  2   575 
3     C  3   14 
4     D  944   205 
5     E  44   87 
6     F  355   883 
7     G  73   150 

> df2  
    X1 X2 X3 X4 X5 X6 term 
1 9 28 3 34 5 39 B 
2 43 7 39 41 46 32 C 
3 17 30 0 27 0 9 D 
4 42 32 1 10 26 49 E 
5 21 17 34 28 35 12 F 
6 16 10 18 25 2 0 G 

我想列的x,y追加從DF1而插入包含term A,而對於各列的其餘部分引入NA行到DF2。

的目標是獲得如下:

X1 X2 X3 X4 X5 X6 x y term 
    NA NA NA NA NA NA 10 417 A 
    9 28 3 34 5 39 2 575 B 
    43 7 39 41 46 32 3 14 C 
    17 30 0 27 0 9 944 205 D 
    42 32 1 10 26 49 44 87 E 
    21 17 34 28 35 12 355 883 F 
    16 10 18 25 2 0 73 150 G 

我嘗試使用公共列合併功能term但沒有工作,然後我找到了解決辦法

cbindPad <- function(...){ 
    args <- list(...) 
    n <- sapply(args,nrow) 
    mx <- max(n) 
    pad <- function(x, mx){ 
    if (nrow(x) < mx){ 
     nms <- colnames(x) 
     padTemp <- matrix(NA, mx - nrow(x), ncol(x)) 
     colnames(padTemp) <- nms 
     if (ncol(x)==0) { 
     return(padTemp) 
     } else { 
     return(rbind(x,padTemp)) 
     } 
    } 
    else{ 
     return(x) 
    } 
    } 
    rs <- lapply(args,pad,mx) 
    return(do.call(cbind,rs)) 
} 

但這並沒有工作。

回答

1

使用merge。請注意,公共列有不同的名稱:type對於df1term對於df2,因此您應該通過by.xby.y參數將此信息傳遞到merge函數。還設置了all=TRUE

> merge(df1, df2, by.x="type", by.y="term", all=TRUE) 
    type x y X1 X2 X3 X4 X5 X6 
1 A 10 417 NA NA NA NA NA NA 
2 B 2 575 9 28 3 34 5 39 
3 C 3 14 43 7 39 41 46 32 
4 D 944 205 17 30 0 27 0 9 
5 E 44 87 42 32 1 10 26 49 
6 F 355 883 21 17 34 28 35 12 
7 G 73 150 16 10 18 25 2 0 
+0

對不起,我實際上重命名保留相同的列名我想我們可以使用'by.x =「type」,by.y =「type」'它確實有效。必須等待接受爲答案:) –

+1

@ Null-Hypothesis,當公共列具有相同的名稱時,可以使用'by = type'並去掉by.x = type'和'by.y = type'。見'?merge' –