我有2個數據框正在使用。一個有一堆位置和座標(經度,緯度)。另一個是天氣數據集,其中包含來自世界各地氣象站的數據和它們各自的座標。我正嘗試將最近的氣象站連接到我的數據集中的每個位置。氣象站名稱和我的位置名稱不匹配。如何根據從一個數據框到另一個數據框的2個鍵找到最接近的匹配項?
我試圖通過座標中最接近的匹配來連接它們,並且不知道從哪裏開始。
我在想一些使用每個
位置
np.abs((location['latitude']-weather['latitude'])+(location['longitude']-weather['longitude'])
例子的...
Location Latitude Longitude Component \
A 39.463744 -76.119411 Active
B 39.029252 -76.964251 Active
C 33.626946 -85.969576 Active
D 49.286337 10.567013 Active
E 37.071777 -76.360785 Active
天氣...
Station Code Station Name Latitude Longitude
US1FLSL0019 PORT ST. LUCIE 4.0 NE 27.3237 -80.3111
US1TXTV0133 LAKEWAY 2.8 W 30.3597 -98.0252
USC00178998 WALTHAM 44.6917 -68.3475
USC00178998 WALTHAM 44.6917 -68.3475
USC00178998 WALTHAM 44.6917 -68.3475
輸出將是位置數據框上的一個新列,與站名最接近匹配
但是,我不確定如何通過循環來實現這一點。任何幫助將不勝感激..
感謝, 斯科特
你能給出你的2個data.frames和期望的輸出樣本嗎? –
除非你特別想用python來做,否則你應該考慮使用postGIS查詢,它們對你的情況來說可以非常快。 – CoderBC
經過更新以反映每個數據幀的樣本以及期望的輸出 – sokeefe1014