大熊貓數據框中有一個熊貓數據幀像下面我如何GROUPBY一些條件
buyer_id item_id order_id date
139 57 387 2015-12-28
140 9 388 2015-12-28
140 57 389 2015-12-28
36 9 390 2015-12-28
64 49 404 2015-12-29
146 49 405 2015-12-29
81 49 406 2015-12-29
140 80 407 2015-12-30
139 81 408 2015-12-30
有很多上述數據幀的行。我試圖實現的是,是否推出新菜餚,以推動我的用戶迴歸。 item_id
被映射到一個菜名。我想看到的是如果特定用戶在不同的日子訂購不同的菜餚。 如buyer_id 140 has ordered two dishes item_id (9,57) on 28th Dec and same buyer has ordered different dish (item_id = 80) on 30th Dec
然後我想將此用戶爲1
如何我在Python中就是這個樣子
item_wise_order.groupby(['date','buyer_id'])['item_id'].apply(lambda x:
x.tolist())
它給了我下面的輸出
date buyer_id
2015-12-28 139 [57]
140 [9,57]
36 [9]
2015-12-29 64 [49]
146 [49]
81 [49]
2015-12-30 140 [80]
139 [81]
所需的輸出
buyer_id item_id order_id date flag
139 57 387 2015-12-28 1
140 9 388 2015-12-28 1
140 57 389 2015-12-28 1
36 9 390 2015-12-28 0
64 49 404 2015-12-29 0
146 49 405 2015-12-29 0
81 49 406 2015-12-29 0
140 80 407 2015-12-30 1
139 81 408 2015-12-30 1
您希望的輸出是什麼? –
@AntonProtopopov我編輯了問題 – Neil
爲什麼預期輸出中第一行的標誌不是1? –