大熊貓應用新列

我有這樣一個數據幀：大熊貓應用新列

import pandas as pd 
import numpy as np 
df=pd.DataFrame({'c1':[1,2,4,5], 
       'c2':[3,'P','N','T'], 
       'c3':np.nan})

的df：

c1 c2 c3 
0 1 3 NaN 
1 2 P NaN 
2 4 N NaN 
3 5 T NaN

我想根據c2列更改c3值：

結果我想要：

c1 c2 c3 
0 1 3 NaN 
1 2 P 1.0 
2 4 N 3.0 
3 5 T 5.0

我用concat得到這個結果：

df1=df[df.c2 == 'P'] 
df1['c3'] =1 
df2=df[df.c2 == 'N'] 
df2['c3'] =3 
df3=df[df.c2 == 'T'] 
df3['c3'] =5 
df4=df[(df.c2 != 'N') & (df.c2 != 'P') & (df.c2 != 'T')] 
new_df=pandas.concat([df1,df2,df3,df4]).reset_index() 
new_df[['c1','c2','c3']]

我想用apply函數來得到相同的結果。我總是更換整個c3列，當我使用apply功能：

def new_col(x,df): 

    if x== 'P': 
     df['c3'] = 1 
    elif x == 'N': 
     df['c3'] = 3 
    elif x == 'T': 
     df['c3'] =5 
    else: 
     df['c3']=np.nan 
df.c2.apply(new_col,df=df) 
df

如何改變new_col功能？

來源

2017-03-29 pang2016

您可以使用：

def new_col(x): 
    a = np.nan 
    if x == 'P': 
     a = 1 
    elif x == 'N': 
     a = 3 
    elif x == 'T': 
     a = 5 
    return a 

df['c3'] = df.c2.apply(new_col) 
print (df) 
    c1 c2 c3 
0 1 3 NaN 
1 2 P 1.0 
2 4 N 3.0 
3 5 T 5.0

另一種解決方案：

df.loc[df.c2 == 'P', 'C3'] = 1 
df.loc[df.c2 == 'N', 'C3'] = 3 
df.loc[df.c2 == 'T', 'C3'] = 5 
print (df) 
    c1 c2 c3 C3 
0 1 3 NaN NaN 
1 2 P NaN 1.0 
2 4 N NaN 3.0 
3 5 T NaN 5.0

來源

2017-03-29 10:17:24 jezrael

大熊貓應用新列

回答

相關問題