我想計算重複測量的平均值,並在一個或兩個重複項具有NaN值時返回NaN。我知道groupby不包括NaN值,但我花了一些時間才意識到apply正在做同樣的事情。以下是我的代碼示例。當兩個重複都缺少數據時,它只返回NaN。在這個例子中,我希望它返回樣本1,樣本2的NaN。相反,它的行爲如同我應用np.nanmean並返回一個非零元素27.0。關於在我正在應用的函數中包含NaN值的策略的任何想法? I
玩具例如 假設base_df是如下所示的微小的數據幀: In [221]: base_df
Out[221]:
seed
I S
0 a 0
b 1
1 a 2
b 3
注意base_df具有2級多指數爲行。 (部分問題涉及在傳播的數據框中「傳播」這個多索引的值)。 現在,函數fn(定義在本文末尾給出)取整數seed作爲參數,並返回1按字符串鍵索