2
我有一個數據幀尋找這樣大熊貓算過多個列
Measure1 Measure2 Measure3 ...
0 1 3
1 3 2
3 0
我想在列數的值的出現,產生:
Measure Count Percentage
0 2 0.25
1 2 0.25
2 1 0.125
3 3 0.373
隨着
outcome_measure_count = cdss_data.groupby(key_columns=['Measure1'],operations={'count': agg.COUNT()}).sort('count', ascending=True)
我只得到第一列(實際上使用graphlab包,但我更喜歡大熊貓)
有人可以幫我嗎?
而當這部分是一個更大的df的一部分?所以我需要指定列?當使用:count = pd.Series(cdss_data ['measure1','measure2']。squeeze()。values.ravel())。value_counts()我得到一個錯誤(cdss_data是我的df) – dsent
您需要雙下標'count = pd.Series(cdss_data [['measure1','measure2']]。squeeze()。values.ravel())。value_count s()' – EdChum
太棒了!有沒有辦法強制行的順序和順序? – dsent