2016-03-01 67 views
0

我有一個格式爲DD-Mmm-YYY的近百萬個日期的列表。我很樂意使用Seaborn's heatmap function來創建日曆熱點圖,以便可視化日曆年(不分年份)的日期分佈情況。我已經想通了如何月份和日期分離成單獨的列,這樣我有:如何使用熊貓將日期列表組織爲月和日計數?

In [8]: df.head() 
Out[8]: 
    original_date month day 
0 05-Sep-2010 Sep 05 
1 08-Apr-2010 Apr 08 
2 03-Aug-2008 Aug 03 
3 03-Feb-2008 Feb 03 
4 14-Mar-2008 Mar 14 

我能做些什麼這個數據幀得到它到具有月份的天爲列的格式,並且月作爲行索引?這是我正在尋找的,但它沒有熊貓,使用csv處理和嵌套字典。

 01 02 03 04 05 06 07 08 09 10 ... 
Jan 1923 371 341 451 437 332 338 398 403 476 ... 
Feb 931 675 891 514 479 452 509 657 507 771 ... 
Mar 1370 906 737 594 469 458 524 368 430 2136 ... 
Apr 1433 1127 706 791 639 817 584 580 515 757 ... 
May 1666 885 884 697 1626 708 809 1053 826 1281 ... 

我想這樣做是大熊貓能夠通過一年來過濾等

回答

0

首先,我將創建一個新的數據幀,通過月份和日期計算(不含一年)

new_df = [] 
for key, grp in df.groupby(['month', 'day']): 

    month, day = key 

    new_df.append({ 
     'month': month, 
     'day': day, 
     'count': len(grp) 
    }) 
new_df = pd.DataFrame(new_df) 

然後你就可以透視這個數據幀給格式化你想

new_df.pivot('month', 'day', 'count')