2012-08-12 80 views
5

我有一個dataframe看起來像下面的變化值:大熊貓數據框 - 基於列標題

In [74]: data2 

Out[74]: 
      a b c 

2012-06-12 0 1 1 
2012-06-13 1 1 0 
2012-06-14 1 0 1 
2012-06-15 1 0 1 
2012-06-16 1 1 0 
2012-06-17 1 0 1 

有沒有一種方法,使值=列標題,其中值= 1?

結果DF:

  a b c 

2012-06-12 0 b c 
2012-06-13 a b 0 
2012-06-14 a 0 c 
2012-06-15 a 0 c 
2012-06-16 a b 0 
2012-06-17 a 0 c 

然後刪除= 0,使得DF降低到2列中的值: (列標題是不相關的,在這一點上)

結果DF:

  1 2 
2012-06-12 c b 
2012-06-13 a b 
2012-06-14 a c 
2012-06-15 a c 
2012-06-16 a b 
2012-06-17 a c 

回答

5
from pandas import * 
df = DataFrame([[0, 1, 1], [1, 1, 0], [1, 0, 1],], columns=['a','b','c']) 

foo = [] 
for i in df.index: 
    foo.append(df.columns[df.ix[i] == 1]) 
DataFrame(foo, index = df.index) 

將返回:

0 1 
0 b c 
1 a b 
2 a c 
6

您還可以召喚一些更深層次的大熊貓福,做:

In [28]: df.apply(lambda x: x.astype(object).replace(1, x.name)) 
Out[28]: 
      a b c 
2012-06-12 0 b c 
2012-06-13 a b 0 
2012-06-14 a 0 c 
2012-06-15 a 0 c 
2012-06-16 a b 0 
2012-06-17 a 0 c