1
我有兩個數據幀。第一個數據幀具有一年的能量,時間間隔爲30分鐘。第二個數據框是30分鐘的一天價格數據。Python DataFrame乘以兩個時間序列數據幀
我該如何乘以兩個數據幀才能得到第二個數據幀被重複乘上第一個數據幀每日的結果?
非常感謝!
我有兩個數據幀。第一個數據幀具有一年的能量,時間間隔爲30分鐘。第二個數據框是30分鐘的一天價格數據。Python DataFrame乘以兩個時間序列數據幀
我該如何乘以兩個數據幀才能得到第二個數據幀被重複乘上第一個數據幀每日的結果?
非常感謝!
您可以按照時間和數量合併您的數據框,首先確保您的日期位於兩個數據框的日期時間索引中。
MVCE:
df1 = pd.DataFrame({'kilowatts':np.random.randint(100,1000,(2*24*365))},index=pd.date_range('2016-01-01',periods=(2*24*365),freq='30T'))
df2 = pd.DataFrame({'Dol_per_KW':np.random.rand(48)},index=pd.date_range('2016-01-01',periods = 48,freq='30T'))
在每個數據幀創建日柱的時間來準備合併的關鍵。
df1['Time'] = df1.index.time
df2['Time'] = df2.index.time
合併和乘法:
df_out = df1.merge(df2, on='Time',right_index=True)\
.eval('cost = kilowatts * Dol_per_KW', inplace=False)\
.sort_index()
讓我們打印10:00至10:30,每天來驗證。
print(df_out.loc[df_out.index.hour == 10].head(10))
輸出:
kilowatts Time Dol_per_KW cost
2016-01-01 10:00:00 187 10:00:00 0.460365 86.088217
2016-01-01 10:30:00 743 10:30:00 0.572282 425.205644
2016-01-02 10:00:00 364 10:00:00 0.460365 167.572786
2016-01-02 10:30:00 668 10:30:00 0.572282 382.284482
2016-01-03 10:00:00 170 10:00:00 0.460365 78.262016
2016-01-03 10:30:00 682 10:30:00 0.572282 390.296432
2016-01-04 10:00:00 336 10:00:00 0.460365 154.682572
2016-01-04 10:30:00 451 10:30:00 0.572282 258.099254
2016-01-05 10:00:00 215 10:00:00 0.460365 98.978431
2016-01-05 10:30:00 295 10:30:00 0.572282 168.823237
非常感謝你!它似乎也可以用DataFrame.mul來做到這一點? – user8486156
爲什麼不DF2延伸到DF1的大小? – Wen
向我們展示您的輸入數據和所需輸出數據的樣本。 –
歡迎來到SO!請查看以下內容,以便其他人可以更好地幫助您。 https://stackoverflow.com/questions/20109391/how-to-make-good-reproducible-pandas-examples – Alexander