2016-04-25 66 views
1

數據:使用df.apply和str.contains( '值',殼體=假)

A  | B | C  
======================== 
Value | Fred | 0 
foo | Jim | 1 
Value | Bob | 2 

我已經寫的方法:

def is_value(df): 
    if df['A'].str.contains('value', case=False): 
     b='X' 
     return b 

我稱之爲

df['B'] = df.apply(is_value, axis=1) 

並得到以下錯誤:

AttributeError: ("'str' object has no attribute 'str'", 'occurred at index 0') 

這是否允許應用?

它與這個成語:

df = df.loc[df['A'].str.contains('Value', case=False) & df['C'] !=0] 
df['A'] = 'X' 

有沒有更好的辦法?

+0

如何才能像SQL更新語句一樣工作? – toasteez

回答

0

如果沒有必要,我認爲最好不要使用apply,因爲顯然它比較慢。

我認爲你可以使用mask

print df['A'].str.contains('value', case=False) 
0  True 
1 False 
2  True 
Name: A, dtype: bool 

df['B'] = df.mask(df['A'].str.contains('value', case=False), 'X') 
print df 
     A B C 
0 Value X 0 
1 foo Jim 1 
2 Value X 2 

loc另一種解決方案:

df.loc[ df['A'].str.contains('value', case=False), 'B'] = 'X' 
print df 
     A B C 
0 Value X 0 
1 foo Jim 1 
2 Value X 2 

編輯:

看來你需要C列中添加過濾值不等於0

print (df['A'].str.contains('value', case=False)) & (df['C'] !=0) 
0 False 
1 False 
2  True 
dtype: bool 

df['B'] = df.mask((df['A'].str.contains('value', case=False)) & (df['C'] !=0), 'X') 
print df 
     A  B C 
0 Value Value 0 
1 foo foo 1 
2 Value  X 2 


df.loc[(df['A'].str.contains('value', case=False)) & (df['C'] !=0) , 'B'] = 'X' 
print df 
     A  B C 
0 Value Value 0 
1 foo foo 1 
2 Value  X 2 
+0

請檢查解決方案,或許需要一些改進。 – jezrael

+0

@jezreail我試圖更新列'B' UPDATE df SET B ='X' WHERE A ='Value'AND'C'!= 0 – toasteez