2017-03-19 59 views

回答

0

下面是我做了什麼來解決這個問題。

import pandas as pd 
import numpy as np 

df = pd.read_csv('data.csv') # get data frame from csv file 

您將無法對您的數據運行數值運算,因爲它是,因爲在dfSale (Dollars)列未格式化爲一個數值類型。以下代碼將將Sale (Dollars)Suggested answer列中的數據轉換爲float類型的數據,並刪除美元符號並分隔逗號。

df[df.columns[2:]] = df[df.columns[2:]].replace('[\$,]', '', regex=True).astype(float) 

然後,我用下面的代碼位以獲得每個獨特Store Number的累計值。

cum_sales_by_store_number = df.groupby('Store Number')['Sale (Dollars)'].agg(np.sum) 
cum_sales_by_store_number = pd.DataFrame(cum_sales_by_store_number) 

輸出爲cum_sales_by_store_number

   Sale (Dollars) 
Store Number 
2106    176849.97 

我希望這回答了你的問題。快樂的編碼!