2017-03-24 34 views
0

如何從一個分組的數據集進行過濾在Python如何從分組數據在Python

s=train['PdDistrict'].value_counts() 
print(s) 

對於上述代碼的輸出是這樣的過濾器: SOUTHERN 157182 現在的任務119908

我需要在執行value_counts時單獨過濾PdDistrict ='MISSION'。
我該如何做到這一點?

+0

我假設你使用熊貓並得到'PdDistrict'列包含'MISSION'字符串的值的計數?你需要更具說明性......無論如何,如果這是你想要的,你可以使用這個'train [train ['PdDistrict']。str.contains(「MISSION」)]。value_counts()' – umutto

+0

謝謝。 但是,當我使用上面的代碼,我收到了這個錯誤 –

回答

0

創建示例數據幀

train = pd.DataFrame({ 
     "A": ["MISSION", "SOUTHERN", "MISSION", "MISSION", "MISSION", "SOUTHERN"], 
     "B": [0, 0, 0, 1, 1, 1] 
    }) 

先用數據幀分配s具有柱A與值MISSION

s = train[train['A'] == 'MISSION'] 

然後,在列數的值A

s['A'].value_counts() 

輸出:

MISSION 4 
Name: A, dtype: int64