後,我有以下csv文件:熊貓數據框中添加列GROUPBY
type sku quantity country account
Order CHG-FOOD1COMP-CA 1 usa hch
Order CHG-FOOD2COMP-CA 1 usa hch
Order CHG-FOOD2COMP-CA 1 usa hch
Order CHG-FOOD1COMP-CA 1 usa hch
Order CHG-FOODCONT1-CA 1 usa hch
Order usa hch
Order Q7-QDH0-EBB5-CA 1 usa hch
Order CHG-FRY-12PT5-CA 1 usa hch
Order Q7-QDH0-EBB5-CA 1 usa hch
Order Q7-QDH0-EBB5-CA 1 usa hch
Order CHG-FRY-12PT5-CA 1 usa hch
Order CB-BB-CLR12-CA 1 usa hch
Order CB-BB-AMB12-CA 1 usa hch
Order usa hch
Order CB-BB-AMB12-CA 1 usa hch
Order CHG-FRY-12PT5-CA 1 usa hch
Order CB-BB-CLR12-CA 1 usa hch
Order CHG-FRY-12PT5-CA 1 usa hch
Order CHG-FOODCONT1-CA 1 usa hch
Refund CHG-FRY-9PT5-CA 1 usa hch
Order CHG-FOOD1COMP-CA 1 usa hch
我有以下的數據。我想要得到每個sku的總量。
SQL: Select sku sum(quantity) As TotalQty, country, account
From (usa_chc_Date.csv)
group by sku,...
我不介意先取之,然後添加那些總是在同一個國家/帳戶列。 我的目的是將信息存儲在這些csv中,以便它們很容易加載到django中,然後刪除這些文件。 這就是我要找:
sku TotalQty country account
sku1 7 mx chc
sku3 4 mx chc
sku4 2 mx chc
sku5 1 mx chc
sku6 7 mx chc
sku7 9 mx chc
我也命名的文件,包括國家/帳戶信息。我想我可以使用這個文件,並在保存模型時去掉國家和帳戶。
備註 - 帳戶不會更改,因爲它們位於同一報告中。一旦他們被加載,他們skus可以有重複,但他們有不同的國家。
我嘗試這樣做:
df = df.groupby(['sku','quantity']).sum()
凡在數據品牌/國家列?目前還不清楚你想要提供的樣本數據。 –
@Andrew我改變了我的問題Acconnt和品牌是一樣的,對不起。我希望它更清楚一點。我正在嘗試每sku總數。所以如果SKU1出現了7個訂單,而其中的2個訂單每個都有2個,其餘的有1個,TotalQty將會是9,並且該行將是:sku |總計|國家|賬戶 –