2
我有一個非常大的數據框,我想做一些重組明智的比較。作爲一個例子讓我們在下面的示例:熊貓:有效的方式來做與groupby對象的循環
df = pd.DataFrame({'A': ['foo', 'bar'] * 3,
'B': ['me', 'you', 'me'] * 2,
'C': [5, 2, 3, 4, 6, 9]})
現在我想通過這些團體由列A組,有效地循環,使排兩比較的方式如下:
gb = df.groupby(['A'])
for k, gp in gb:
for i in arange(len(gp['C'])):
sum = 0
for j in arange(len(gp['C'])):
if (i != j):
sum = sum + gp['C'].irow(j)
print gp['C'].irow(i) - sum
有可以更高效地執行此操作,並將其結果分配給Dataframe中的單獨列。
我會非常感激你的幫助
安迪
嗨帝斯曼,非常感謝您的幫助。對困惑感到抱歉。計算方式只是一個例子。實際上,在我需要做計算的行中有對象。你會爲這個特殊情況推薦什麼? – Andy