我有來自兩個不同氣象站的位置數據。一個電臺在80年代安裝,另一個電臺在90年代中期安裝。由於儀器故障,舊站的讀數變得不可靠。還有幾個新站的記錄缺失的情況。基於時間合併數據幀
我打算在安裝新站之前使用舊站的數據創建一個完整的天氣資料,並從新站添加數據。另外我想在新站(NaN)出現儀器故障時使用舊站的數據。
df_new =pd.DataFrame(
{'Date': {0: '01/01/1994', 1: '01/02/1994', 2: '01/03/1994', 3: '01/04/1994'},
'Rain': {0: 0, 1: 0, 2: 0, 3: 0},
'TMAX': {0: -5.5, 1: np.nan, 2: -1.5, 3: np.nan},
'TMIN': {0: -11.64, 1: -10.55, 2: np.nan, 3: -11.41},
'WIND': {0: 4.1, 1: 6.8, 2: 5.4, 3: 9.6}})
df_old = pd.DataFrame(
{'Date': {0: '01/01/1980', 1: '01/02/1980', 2: '01/03/1980', 3: '01/04/1980'},
'Rain': {0: 0, 1: 0, 2: 0, 3: 0},
'TMAX': {0: -5.5, 1: -3.5, 2: -1.5, 3: -2.8},
'TMIN': {0: -11.64, 1: -10.55, 2: -14.33, 3: -11.41},
'WIND': {0: 4.1, 1: 6.8, 2: 5.4, 3: 9.6}})
我該如何結合這兩個df並創建一個像這樣的新df(df_complete)?
df_complete
Date Rain TMAX TMIN WIND
01/01/1980 0 -5.5 -11.64 4.1
01/02/1980 0 -3.5 -10.55 6.8
01/03/1980 0 -1.5 -14.33 5.4
.
.
01/01/1994 0 -5.5 -11.64 4.1
01/02/1994 0 5.7 -10.55 6.8
01/03/1994 0 -1.5 -10.58 5.4
.
.
12/31/2014 0 -4.9 -10.21 3.5
,只讓自己更清楚,在df_new的NaN值使用值代替從df_old
你沒有真正表達過一個問題。你想要解決什麼問題? – Brian
請讓我知道它是否更容易理解。 –
是的 - 這是很好的添加一個簡單的方法來啓動示例數據遊戲。這增加了您及時回答的可能性。在我的例子中,我用to_dict()將其渲染出來。 – Dickster