我處理的一個熊貓數據幀像這樣的:提取新列與數出熊貓的數據幀GROUPBY的
Day Hour Prio Value
0 1 6 Critical 1
1 1 16 Critical 1
2 1 17 Content 1
3 1 17 Low 1
6 1 19 Critical 1
7 1 20 High 1
8 2 10 High 1
9 2 10 Low 2
,現在我想希望通過日和小時組,而產生代表計數新列列Prio
中的每個值中的每個值,其當前存在於列value
中。所以我想達到這樣的結構:
Day Hour Critical Content Low High
0 1 6 1 0 0 0
1 1 16 1 0 0 0
2 1 17 0 1 1 0
6 1 19 1 0 0 0
7 1 20 0 0 0 1
8 2 10 0 0 2 1
我現在嘗試了不同的事情,但一直都不是很成功。我的目標是將這個數據框與Day和Hour中包含的其他列合併,以便進一步聚合它們。特別是我需要優先級中每天/每小時的百分比份額(至少有一個非零值總是存在)。
在過去的解決方案中,我遍歷每一行以提取單個值,但這一直很慢。我希望保持它儘可能高效,因爲數據應該在散景服務器應用程序中更新。也許有沒有使用itertuples
或類似的解決方案?謝謝!
'unstack'是缺少的環節這裏我不知道,沒有它我怎麼能活下去。與我先前謙遜的方法相比,您的解決方案以及'pivot_table'工作得非常好,性能卓越。謝謝! – AdmPicard