更快列讓我們採取兩種dataframes:A和B包含類似以下數據:比較不同dataframes
Dataframe: A Dataframe: B
ColA ColB1 ColB2
| Dog | | Lion | yes
| Lion | | Cat |
| Zebra | | Elephant |
| Bat | | Dog | yes
要可樂的值進行比較,以ColB1的值,以便插入是在ColB2列匹配的情況。我正在運行的是這樣的:
for (i in 1:nrow(B)){
for (j in 1:nrow(A)){
if (B[i,1] == A[j,1]){
B[i,2] <- "yes"
}
}
}
實際上我們正在談論abaout 20000行。這怎麼會變得更快?
請'dput'你例子data.frames。他們目前顯示的方式沒有幫助。如果你想自己嘗試一下,看看'?match'和'%in%'操作符。 – lmo
矢量化!你基本上需要檢查'%%' –