如何將所有列與熊貓中的一列進行比較？

對於以下DF如何將所有列與熊貓中的一列進行比較？

   A  B  ..... THRESHOLD    
DATE          
2011-01-01  NaN  NaN .....  NaN 
2012-01-01 -0.041158 -0.161571 ..... 0.329038 
2013-01-01 0.238156 0.525878 ..... 0.110370 
2014-01-01 0.606738 0.854177 ..... -0.095147 
2015-01-01 0.200166 0.385453 ..... 0.166235

我要比較像A，B，C的列的N個....與THRESHOLD並輸出結果等

df['A_CALC'] = np.where(df['A'] > df['THRESHOLD'], 1, -1) 
df['B_CALC'] = np.where(df['B'] > df['THRESHOLD'], 1, -1)

如何應用上述對於所有列（A，B，C ...），沒有明確寫每列一條語句？

來源

2017-08-06 Shakti

您可以使用df.apply：

In [670]: df.iloc[:, :-1]\ 
      .apply(lambda x: np.where(x > df.THRESHOLD, 1, -1), axis=0)\ 
      .add_suffix('_CALC') 
Out[670]: 
      A_CALC B_CALC 
Date      
2011-01-01  -1  -1 
2012-01-01  -1  -1 
2013-01-01  1  1 
2014-01-01  1  1 
2015-01-01  1  1

如果THRESHOLD是不你的最後一欄，你會更好使用

df[df.columns.difference(['THRESHOLD'])].apply(lambda x: np.where(x > df.THRESHOLD, 1, -1), axis=0).add_suffix('_CALC')

來源

2017-08-06 01:51:56

我認爲你可以在'pandas'中使用'where'而不是'numpy'，這仍然是一個很好的解決方案 – Wen

下面是否足夠？

for col in df.columns.values: 
    if col!= 'THRESHOLD': 
     newname = col+'_CALC' 
     df[newname] = np.where(df[col] > df['THRESHOLD'], 1, -1)

來源

2017-08-06 01:50:23 durbachit

從不建議在熊貓列上操作時使用for循環。 –

哎唷！這是爲什麼？我從來沒有遇到過這個問題，雖然我可以想象它是相當耗時的...... – durbachit

正是因爲它很費時：] –

或者，也許你可以試試這個，通過使用subtract，應該快於apply

(df.drop(['THRESHOLD'],axis=1).subtract(df.THRESHOLD,axis=0)>0)\ 
    .astype(int).replace({0:-1}).add_suffix('_CALC')

來源

2017-08-06 01:59:59 Wen

如何將所有列與熊貓中的一列進行比較？

回答

相關問題