2017-07-20 43 views
0

我已經在2列數值向量(R中)中獲得了商店ID及其Zipcode的列表。我正在使用「Zipcode」包(https://cran.rproject.org/web/packages/zipcode/zipcode.pdf),並可以訪問這些郵編的經/緯度座標。郵政編碼軟件包有一個數據框,每個郵政編碼,城市,州,以及所有郵編的經度和緯度(作爲一個大型數據框)。將一列數據幀與另一列匹配,拉入其他列,合併成大數據集

我希望得到的經度和我的郵編緯度座標,並將其添加爲第3,4列(即店鋪ID,郵編,經度,緯度)

有什麼想法? 謝謝!

編輯:我試過合併函數(即)總共<-合併(CleanData,zipcode,by = zip),我得到一個錯誤,因爲他們必須有相同數量的列?

回答

0

作爲by參數傳遞的列名必須括在引號內。在此示例中,您不需要在合併中使用by參數,如果是,則zipcode是兩個數據框中唯一的公用列。

實施例的數據集:

#cleanData 
d1<-tibble::tribble(~z,~id,131,1,114,2,155,5) 

#zipcode 
d2<- 
tibble::tribble(~z,~x,~y,131,2,5,166,2,6,162,6,5,177,7,1,114,2,1,155,5,9) 

result <- merge(d1,d2) 

給出

 z id x y 
    1 114 2 2 1 
    2 131 1 2 5 
    3 155 5 5 9 

可以通過簡單地使用dplyr::select()除去從結果數據幀的任何不必要的列。假設你不需要列Ÿ(這可能是一個國家的名稱,例如)

result <- dplyr::select(result, z, id, x) 
相關問題