1
我有一個數百萬記錄的數據框,我試圖讓整個數據框按一列'napciente'分組,這是完成的。但有63列,我需要根據特定的匹配聚合爲字符串,例如,如果系列包含「SI」和任何其他字符串我想要返回該「SI」作爲我的聚合結果。如何爲字符串編寫自定義聚合函數?
所以我需要定義自己的聚集是發現在該系列中的字符串,並將其返回。這裏我只發佈數據爲1組和截斷列
data.groupby('npaciente')['asistencia'].apply(lambda x: if x.str.find("SI"): return "SI")
以上是無效的,建議?
所有的比賽條件都一樣嗎? – Grr
不,它們根據列進行更改 – alex