2015-12-05 46 views
0

我有一個CSV文件在我的筆記本ipython如下所示解釋GROUPBY()的熊貓數據幀對象行爲

Hour,L,Dr,Tag,Code,Vge 
0,L5,XI,PS,4R,15 
0,L3,St,sst,4R,17 
5,L5,XI,PS,4R,12 
2,L0,St,v2T,4R,11 
8,L2,TI,sst,4R,8 
12,L5,XI,PS,4R,18 
2,L2,St,PS,4R,9 
12,L3,XI,sst,4R,16 

我執行下面的腳本。

In[1] 
    import pandas as pd 
In[2] 
    df = pd.read_csv('/python/concepts/pandas/in.csv') 
In[3]  
    df.head(n=9) 

Out[1]: 

     Hour L Dr Tag Code Vge 
    0  0 L5 XI PS 4R 15 
    1  0 L3 St sst 4R 17 
    2  5 L5 XI PS 4R 12 
    3  2 L0 St v2T 4R 11 
    4  8 L2 TI sst 4R 8 
    5 12 L5 XI PS 4R 18 
    6  2 L2 St PS 4R 9 
    7 12 L3 XI sst 4R 16 

In[4] 
    df.groupby(('Hour'))['Vge'].head(n=9) 
Out[2] 

    0 15 
    1 17 
    2 12 
    3 11 
    4  8 
    5 18 
    6  9 
    7 16 
    Name: Vge, dtype: int64 

似乎輸出不被Hour分組.Rather它看起來是dataframe內部索引的順序輸出。

我想了解熊貓dataframe中的groupby使用情況。如果有人能指導我,我將不勝感激。

+0

你期待什麼結果呢? –

+0

@MikeMüller - 我希望它可以按小時分組。例如,對於「Hour」0,2和12有兩個值。我希望它們一起出現。我的理解錯了嗎? – liv2hak

回答

1

你需要對團隊做些什麼。例如:

>>> df.groupby('Hour').sum() 
     Vge 
Hour  
0  32 
2  20 
5  12 
8  8 
12  34 

或:

>>> df.groupby('Hour').count()['Vge'] 
Hour 
0  2 
2  2 
5  1 
8  1 
12 2 
Name: Vge, dtype: int64 
+0

Muller - 只有在您對其執行操作時纔會按「小時」分組? – liv2hak

+1

是的。你需要告訴它該做什麼。 –