下面是我做了什麼來解決這個問題。
import pandas as pd
import numpy as np
df = pd.read_csv('data.csv') # get data frame from csv file
您將無法對您的數據運行數值運算,因爲它是,因爲在df
的Sale (Dollars)
列未格式化爲一個數值類型。以下代碼將將Sale (Dollars)
和Suggested answer
列中的數據轉換爲float類型的數據,並刪除美元符號並分隔逗號。
df[df.columns[2:]] = df[df.columns[2:]].replace('[\$,]', '', regex=True).astype(float)
然後,我用下面的代碼位以獲得每個獨特Store Number
的累計值。
cum_sales_by_store_number = df.groupby('Store Number')['Sale (Dollars)'].agg(np.sum)
cum_sales_by_store_number = pd.DataFrame(cum_sales_by_store_number)
輸出爲cum_sales_by_store_number
:
Sale (Dollars)
Store Number
2106 176849.97
我希望這回答了你的問題。快樂的編碼!