1
我在pandasas DF表:安排在大熊貓的訂單價值DF
p_id_x p_id_y count
a b 2
b c 4
a c 8
d a 1
x a 6
m b 3
c z 7
我WAM特林編寫一個函數
def function_combination(p_id):
df[['p_id_x', 'p_id_y']] = df[['p_id_x', 'p_id_y']].apply(sorted, axis=1)
df.groupby(['p_id_x', 'p_id_y'], as_index=False)['count'].sum()
(該功能沒有完成,有錯誤) 我通過單獨運行函數內的代碼得到了結果。
df['p_id_x','p_id_y']
p_id_x p_id_y
a b
b c
a c
a d
a x
b m
c z
但我想我的輸出看起來像爲:
p_id_x p_id_y
a b
a c
a d
a x
b c
b m
c z
i'e所有的第一組合,繼以B,並隨後c。
這只是我行的一部分。我有20多個這樣的行。 有沒有辦法做到這一點,這樣我就可以在函數中使用我的代碼?
是有辦法,我可以得到數每個值在我的p_id_x? 我想給我的功能,如果條件如果條件如果> 3如果計數然後做一些' – Shubham
請參閱更新。 – jezrael
是的,其實我剛剛意識到我在開始時犯了一個大錯。 說,如果我有組合(A-C),和(C-A)'。適用(排序)'會comvert(C-a)至(A-C),因此我的C的組合都將丟失。這阻礙了我的解決方案。我會以其他方式解決它。然後使用你的解決方案 – Shubham