2016-12-19 74 views
1

我有兩個數據幀,我想在日期列合併。熊貓在日期時間合併兩個不同大小的數據幀

第一數據幀保存日期時間:

DateTime,Date,Hour 

    2015-01-01 00:00:00 | 2015-01-01 | 00 
    2015-01-01 00:00:01 | 2015-01-01 | 01 

    ... 

    2015-01-01 23:00:00 | 2015-01-01 | 23 

第二個擁有它每天:

> Date,Col3 
> 
> 2015-01-01 | daily something1 
> 
> 2015-01-02 | daily something2 

-

我想在日期欄合併,這樣,在一個日18:00將具有第二個數據幀採用的相同日常功能。

2015-01-01 00:00:00 | 2015-01-01 | 00 | daily something1 

2015-01-01 01:00:00 | 2015-01-01 | 01 | daily something1 

... 

2015-01-02 00:00:00 | 2015-01-01 | 23| daily something2 

它可以通過編寫一些代碼來完成,但我可以使用連接或合併做到這一點嗎?試圖用左,右連接做到這一點,但無法完成。

回答

0

我們按照您所描述的方式合併以下兩個數據框。我不知道是否有一個不錯的線程來完成這個任務,我想看一個,但是這個方法是有效的。

import pandas as pd 

df = pd.DataFrame({'DATE': pd.date_range(start='2016-01-01 00:00:00', 
             freq='12H', periods=10)}) 
df2 = pd.DataFrame({'DATE': pd.date_range(start='2016-01-01', 
              freq='D', periods=5), 
        'VALUE': range(0,5)}) 

# extract the date from each column 
df['DATE_DAY'] = df['DATE'].dt.date 
# even though the df2 DATE column only shows the date, it's still in 
# a different type (datetime64[ns]), so we have to convert it as well 
df2['DATE_DAY'] = df2['DATE'].dt.date 

tmp = df.merge(df2, on='DATE_DAY') 
>>> tmp 
       DATE_x  DATE_y DATE_DAY VALUE 
0 2016-01-01 00:00:00 2016-01-01 2016-01-01  0 
1 2016-01-01 12:00:00 2016-01-01 2016-01-01  0 
2 2016-01-02 00:00:00 2016-01-02 2016-01-02  1 
3 2016-01-02 12:00:00 2016-01-02 2016-01-02  1 
4 2016-01-03 00:00:00 2016-01-03 2016-01-03  2 
5 2016-01-03 12:00:00 2016-01-03 2016-01-03  2 
6 2016-01-04 00:00:00 2016-01-04 2016-01-04  3 
7 2016-01-04 12:00:00 2016-01-04 2016-01-04  3 
8 2016-01-05 00:00:00 2016-01-05 2016-01-05  4 
9 2016-01-05 12:00:00 2016-01-05 2016-01-05  4