我有一個數據集,我正在清理並具有我想合併的某些行(觀察值)。最好的方式來解釋什麼,我要做的是用下面的例子:從每個變量(列)中刪除NAs併合併案例
df<-data.frame(fruits=c("banana","banana","pineapple","kiwi"),cost=c(1,NA,2,3),weight=c(NA,1,2,3),stringsAsFactors = F)
df
cost<-df[,1:2]
weight<-df[,c(1,3)]
cost
weight
cost<-cost[complete.cases(cost),]
weight<-weight[complete.cases(weight),]
key<-data.frame(fruits=unique(df[,1]))
key
mydata<-merge(key,cost,by="fruits",all.x = T)
mydata<-merge(mydata,weight,by="fruits",all.x = T)
mydata
在前面的例子中,我想保持從香蕉兩個變量(成本和重量)的信息,但不幸的是在不同的記錄。我能夠爲一個變量手動完成,但我的實際數據集有幾十個變量。我想知道如何完成上面完成的任務,但使用dplyr或應用於一組列。
的問題需要多一點的數據 - 我們可以假定成本始終對每個項目一樣嗎?我們可以假設成本和重量總是相同的嗎?你的原始數據看起來像DF還是像成本和重量? – jeremycg
看到你在這裏做什麼真的很麻煩,因爲你堅持要覆蓋你創建的每一個對象。 – Frank