0
我只是想保持行的熊貓數據幀滿足下列條件:當第二個條件滿足時,第一個條件不滿足
1)用戶應已與之互動的超過X項目 2)項目應已與之互動與超過Y用戶
當滿足第二個條件,應用這兩個條件後,對於某些用戶,第一個條件失敗。
groupById = df.groupby(['id']).count()
remaining = groupById[groupById.itemId > X]
df2 = df.loc[df.id.isin(remaining.index)]
groupByItem = df2.groupby(['id']).count()
remainingIt = groupByItem[groupByItem.id > Y]
final = df[df.id.isin(remaining.index) & df.itemId.isin(remainingIt.index)]
我無法理解這個遞歸問題。任何人?
你是如何確定第一條件失敗? – EFT
也許當你計算第一個條件,你使用所有的項目(過濾之前),並在你過濾後,你顯然有更少的項目,所以第一個條件可能會失敗 – Dotan