1
我有一個熊貓數據幀像以下一些條件..如何計算比對大熊貓數據幀
date item_id
2016-01-19 [188, 188]
2016-01-23 [188, 142]
2016-02-05 [188, 264]
2016-02-06 [273, 248, 191, 167, 238, 191]
2016-02-15 [320]
2016-02-17 [286]
2016-02-20 [164, 317]
在上面我想計算因此,在上述情況下item_id 188
重複3次在3 No of times the item_id got repeated on different dates/no of unique item_id
的比例不同天,這樣的比值將是 3/no of unique item_id
3/13
代碼來創建一個數據幀
buyer_id item_id date
261_23 188 2016-01-19
261_23 188 2016-01-19
261_23 188 2016-01-23
261_23 142 2016-01-23
261_23 188 2016-02-05
261_23 264 2016-02-05
261_23 273 2016-02-06
261_23 248 2016-02-06
261_23 191 2016-02-06
261_23 167 2016-02-06
261_23 238 2016-02-06
261_23 191 2016-02-06
261_23 320 2016-02-15
261_23 286 2016-02-17
261_23 164 2016-02-20
261_23 317 2016-02-20
df.groupby(['date','buyer_id'])['item_id'].apply(lambda x: x.tolist())
它給我'num_appearances'爲'[1,1,1,1,1,1,1,1,1,1,1,1]''但有188' 3項 – Neil
@Neil添加了我試過的DataFrame +代碼,你可以看到它不會統一輸出1。如果您發佈了創建DataFrame的確切代碼(*不是*您的問題中的prinout),我也可以運行它。就目前而言,我無法確定您的DataFrame與我的區別。 –
它返回我最終輸出爲'{ '142':0.083333333333333329, '164':0.083333333333333329, '167':0.083333333333333329, '188':0.083333333333333329, '191':0.083333333333333329, '238':0.083333333333333329, '248':0.083333333333333329, '264':0.083333333333333329, '273':0.083333333333333329, '286':0.083333333333333329, '317':0.083333333333333329, '320':0.083333333333333329}' – Neil