我有兩個數據幀 - 一個是巨大(超過200萬行)和一個較小(約30萬行)。較小的數據框是較大數據框的一個子集。唯一的區別是較大的有一個額外的屬性,我需要添加到較小的一個。合併2數據幀,丟棄不匹配的行
具體地,對於大的數據幀的屬性(日期,時間,地址,標誌)和用於小的數據幀的屬性(日期,時間,地址)。我需要以某種方式將正確的相應標誌值存入每行較小的數據幀中。 「合併」數據幀的最終大小應該與我的較小數據幀相同,從大數據幀中丟棄未使用的行。
完成此操作的最佳方法是什麼?
更新:我測試用下面的合併函數:
new<-merge(data12, data2, by.x = c("Date", "Time", "Address"),
by.y=c("Date", "Time", "Address"))
和
new<-merge(data12, data2, by = c("Date", "Time", "Address"))
都返回與屬性的權數的空數據幀(新)以及以下警告信息:
Warning message:In `[<-.factor`(`*tmp*`, ri, value = c(15640, 15843, 15843, 15161, : invalid factor level, NAs generated
'merge'默認情況下將只返回行的表現兩個輸入相匹配。 –
如果我使用合併,將返回的數據幀的大小等於較小的一個? – whistler
以及它會從一個更大的一些資料...那你幹嘛要來合併。看看'?merge' –