2
我想部分「崩潰」一個DataFrame
/矩陣,並保持結構的完整性,只需將濃縮值相加即可。例如,我有:Python熊貓部分坍塌2d矩陣
CHROM POS GENE DESC JOE FRED BILLY SUSAN TONY
10 1442 LOXL4 bad 1 0 0 1 0
10 335 LOXL4 bad 1 0 0 0 0
10 3438 LOXL4 good 0 0 1 0 0
10 4819 PYROXD2 bad 0 1 0 0 0
10 4829 PYROXD2 bad 0 1 0 1 0
10 9851 HPS1 good 1 0 0 0 0
前4列是描述符,最後4列是人/觀察值。最終目標是要計算每個GENE每個人有多少個「好」和「壞」觀察值。因此,我想這一點:
GENE DESC JOE FRED BILLY SUSAN TONY
LOXL4 bad 2 0 0 1 0
LOXL4 good 0 0 1 0 0
PYROXD2 bad 0 2 0 1 0
HPS1 good 1 0 0 0 0
下面的代碼摺疊所有個人意見(喬,弗雷德,等等),我怎樣才能讓他們分開?我也想有足夠的靈活性,以適應未來更多的人(保持相同的4個描述符列)
mytable.groupby(['GENE','DESC']).size()
的感謝!現在我可以閱讀聚合以及 – alexhli 2012-08-09 17:34:26
另外'grouped.sum()'是'grouped.agg(np.sum)' – 2012-08-10 19:22:24
@DanielVelkov的簡寫你說得對,謝謝,我已經更新了答案。 – bmu 2012-08-11 15:41:18