2016-10-19 80 views
-1

我有一個數據集,其中包含每個事件的id列和數據框中的value列(以及其他列)。我想要做的是根據它是否在第90百分位數,第50百分位數,第25百分位數等等來分類每個id如何根據熊貓中的列檢查每行的百分位數?

例,

id  value 
1  12.5 
2  4.6 
.... 

所以,我想補充另一列取決於它落在值列的什麼百分category它。我該怎麼辦呢?

+0

我的答案不是你所期望的嗎? – IanS

回答

0

您正在尋找方法quantile。例如,分配到0.0, 0.25, 0.5, 0.75分位數可以這樣完成:

df['quantile'] = 0.0 

for q in [0.25, 0.5, 0.75]: 
    df.loc[df['value'] >= df['value'].quantile(q), 'quantile'] = q 
相關問題