-1
我有一個數據集,其中包含每個事件的id
列和數據框中的value
列(以及其他列)。我想要做的是根據它是否在第90百分位數,第50百分位數,第25百分位數等等來分類每個id
。如何根據熊貓中的列檢查每行的百分位數?
例,
id value
1 12.5
2 4.6
....
所以,我想補充另一列取決於它落在值列的什麼百分category
它。我該怎麼辦呢?
我有一個數據集,其中包含每個事件的id
列和數據框中的value
列(以及其他列)。我想要做的是根據它是否在第90百分位數,第50百分位數,第25百分位數等等來分類每個id
。如何根據熊貓中的列檢查每行的百分位數?
例,
id value
1 12.5
2 4.6
....
所以,我想補充另一列取決於它落在值列的什麼百分category
它。我該怎麼辦呢?
您正在尋找方法quantile
。例如,分配到0.0, 0.25, 0.5, 0.75
分位數可以這樣完成:
df['quantile'] = 0.0
for q in [0.25, 0.5, 0.75]:
df.loc[df['value'] >= df['value'].quantile(q), 'quantile'] = q
我的答案不是你所期望的嗎? – IanS