比較不同dataframes

更快列讓我們採取兩種dataframes：A和B包含類似以下數據：比較不同dataframes

Dataframe: A    Dataframe: B 
    ColA      ColB1  ColB2 
| Dog |     | Lion  | yes 
| Lion |     | Cat  | 
| Zebra |     | Elephant | 
| Bat |     | Dog  | yes

要可樂的值進行比較，以ColB1的值，以便插入是在ColB2列匹配的情況。我正在運行的是這樣的：

for (i in 1:nrow(B)){ 
    for (j in 1:nrow(A)){ 
     if (B[i,1] == A[j,1]){ 
      B[i,2] <- "yes" 
     } 
    } 
}

實際上我們正在談論abaout 20000行。這怎麼會變得更快？

來源

2017-08-31 Dino C

請'dput'你例子data.frames。他們目前顯示的方式沒有幫助。如果你想自己嘗試一下，看看'？match'和'％in％'操作符。 – lmo

矢量化！你基本上需要檢查'％％' –

可以使用%in%運營商以確定成員：

B$ColB2 <- B$ColB1 %in% A$ColA

ColB2將包含TRUE/FALSE依賴於數據幀B的ColB1值是否在數據幀A的ColA被發現。

來源

2017-08-31 15:16:57 Vince

感謝您的答覆。除此之外，是否有可能避免Loop的嵌套？ –

這不需要循環。它按原樣工作。 – Vince

比較不同dataframes

回答

相關問題