2
我有一個埃博拉數據集與499記錄。我試圖根據概率(概率變量)找出每個五分位數中的觀測值的數量。觀察的數量應該落入類別0-20%,20-40%等我的代碼,我認爲要做到這一點,排序從qcut在熊貓python的五分之一輸出
test = pd.qcut(ebola.prob,5).value_counts()
這將返回
[0.044, 0.094] 111
(0.122, 0.146] 104
(0.106, 0.122] 103
(0.146, 0.212] 92
(0.094, 0.106] 89
我的問題是,我該怎麼辦對此進行排序以返回0-20%,20-40%40-60%60-80%80-100%的正確觀察值?
我已經試過
test.value_counts(sort=False)
這將返回
104 1
89 1
92 1
103 1
111 1
這是命令104,89,92,103,111?每個五分位數?
我很困惑,因爲如果我看看我的第一段代碼的概率輸出,它看起來應該是111,89,103,104,92?
感謝我多次使用value_counts()。我修改爲測試= pd.qcut(ebola.prob,5).value_counts(sort = False) – oldtimetrad