-1
我有一個交易的數據幀(15K行):交易數據分析
customer_id order_id order_date var1 var2 product_id \
79 822067 1990-10-21 0 0 51818
79 771456 1990-11-29 0 0 580866
79 771456 1990-11-29 0 0 924147
156 720709 1990-06-08 0 0 167205
156 720709 1990-06-08 0 0 132120
product_type_id designer_id gross_spend net_spend
139 322 0.174 0.174
139 2366 1.236 1.236
432 919 0.205 0.205
474 4792 0.374 0.374
164 2243 0.278 0.278
我想組由product_type_id
和爲每個客戶事務的時間倉。要更清楚地瞭解每個customer_id
我想知道客戶在過去30,60,90,120,150,180,360天中從同一類別購買了多少次(從1991-01-01開始例如)。
對於每一位顧客,我還希望他有多少總購買量,他從多少個不同的不同product_type_id中購買了總net_spend。
這是我不清楚如何減少數據作爲平板大熊貓數據幀,每customer_id
一行....
我能與像一個simplifiead觀點:
transactions['order_date'] = transactions['order_date'].apply(lambda x: dt.datetime.strptime(x,"%Y-%m-%d"))
NOW = dt.datetime(1991,01,01)
Table = transactions.groupby('customer_id').agg({ 'order_date': lambda x: (NOW - x.max()).days,'order_id': lambda x: len(set(x)), 'net_spend': lambda x: x.sum()})
Table.rename(columns={'order_date': 'Recency', 'order_id': 'Frequency', 'net_spend': 'Monetization'}, inplace=True)
我們希望看到你在解決這個問題上的一些努力。 – Dark
您可能還想添加預期的輸出,以便我們知道需要什麼。 – Dark
對不起Bharath你是對的。 – user3620915