我有以下的數據幀,並想:熊貓集團 - 包括所有列
- 組記錄由
month
- 總和
QTY_SOLD
和各UPC_ID
(每月)獨特的NET_AMT
- 附上其餘的列以及產生的數據幀
我認爲我可以做到這一點的方式是第1種:創建month
列彙總D_DATES
,然後通過UPC_ID
彙總QTY_SOLD
。
腳本:
# Convert date to date time object
df['D_DATE'] = pd.to_datetime(df['D_DATE'])
# Create aggregated months column
df['month'] = df['D_DATE'].apply(dt.date.strftime, args=('%Y.%m',))
# Group by month and sum up quantity sold by UPC_ID
df = df.groupby(['month', 'UPC_ID'])['QTY_SOLD'].sum()
當前數據幀:
UPC_ID | UPC_DSC | D_DATE | QTY_SOLD | NET_AMT
----------------------------------------------
111 desc1 2/26/2017 2 10 (2 x $5)
222 desc2 2/26/2017 3 15
333 desc3 2/26/2017 1 4
111 desc1 3/1/2017 1 5
111 desc1 3/3/2017 4 20
所需的輸出:
MONTH | UPC_ID | QTY_SOLD | NET_AMT | UPC_DSC
----------------------------------------------
2017-2 111 2 10 etc...
2017-2 222 3 15
2017-2 333 1 4
2017-3 111 5 25
實際輸出:
個MONTH | UPC_ID
----------------------------------------------
2017-2 111 2
222 3
333 1
2017-3 111 5
...
問題:
- 怎樣包括每一行的一個月?
- 如何包含數據框的其餘列?
- 除了
QTY_SOLD
之外,怎麼樣還總結NET_AMT
?