2017-03-14 26 views
0

我有兩組座標,其中一組帶有49,898個x和y的組合(我們稱之爲組A),另一組座標爲36,404個x和y的組合(讓我們打電話給我們這組B)。組A具有組B中的所有組合,但具有額外的13,494種組合。我想提取這組獨特的13,494組合。爲了嘗試使用excel或R提取這些唯一值(如果有人提出了使用這兩種方法的解決方案,我會很高興),我已經將Set B的x座標系和y座標系組合複製到Set A的同一列中。提取兩組座標之間的獨特組合

簡單的圖像顯示的是表格佈局:x and y example

我已經通過一些職位提出利用EXCEL &的R這部分處理除了輸出這個問題的閱讀始終是49898點的組合,因爲他們保持「原始」一套重複值。我理解這是爲什麼,但我想要完全刪除這些重複項,以便我有一個包含Set A的唯一13,494組合的最終輸出。

Excel的我用下面的:數據 - >高級過濾器 - >重複的記錄

在RI使用本主題中下面的代碼:

UniqRemDups <- unique(RemDups[,c('Xcod','Ycod')]) 

How to filter for unique combination of columns from an R dataframe

任何幫助/建議將不勝感激。謝謝。

+1

你能提供一個[重複的例子(http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example)? – jsb

回答

1

使用mgcv中uniquecombs函數的R中的一種方法。

data <- structure(list(Xcod = c(4405000L, 4415000L, 4425000L, 4435000L, 
4445000L, 4455000L, 4465000L, 4475000L, 4435000L, 4495000L, 4505000L, 
4515000L, 4525000L, 4535000L, 4545000L, 4555000L, 4565000L, 4575000L, 
4585000L), Ycod = c(4725000L, 4725000L, 4725000L, 4725000L, 4725000L, 
4725000L, 4725000L, 4725000L, 4725000L, 4725000L, 4725000L, 4725000L, 
4725000L, 4725000L, 4725000L, 4725000L, 4725000L, 4725000L, 4725000L 
)), .Names = c("Xcod", "Ycod"), class = "data.frame", row.names = c(NA, 
-19L)) 

library(mgcv) 
unique_rows <- uniquecombs(data) 
+0

OP說他們有兩個數據集,但你的例子只有一個..? – Frank