我有一個包含事務的數據框。索引是交易的日期(時間戳),列是價格(浮動),城市(字符串)和產品名稱(字符串)。我想向包含每個城市中每個產品的最低價格的數據框添加一個新列。因此,對於城市和產品相同的每一行,第四列將具有相同的值。熊貓:使用其他列的子組中的值創建新列
這裏的示例代碼:
# dictionary of transactions
d = {'1': ['20', 'NYC', 'Widget A'], '2': ['30', 'NYC', 'Widget A'], '3': ['5', 'NYC', 'Widget A'], \
'4': ['300', 'LA', 'Widget B'], '5': ['30', 'LA', 'Widget B'], '6': ['100', 'LA', 'Widget A']}
columns=['Price', 'City', 'Product']
# create dataframe and rename columns
df = pd.DataFrame.from_dict(data=d, orient='index')
df.columns = columns
這將產生一個數據幀,看起來像這樣
Price City Product
1 20 NYC Widget A
2 30 NYC Widget A
3 5 NYC Widget A
4 300 LA Widget B
5 30 LA Widget B
6 100 LA Widget A
所以我想添加一個新列與最低的價格爲每個城市/產品羣。因此第1-3行(所有NYC/Widget A)將是5(第3行中的最低價格),第4和5行將具有30(均爲LA/Widget B),並且第6行將具有值爲100.
請添加一些示例代碼和預期輸出,以便重現您的問題。 –
對於第二個請求,添加輸入和輸出的示例數據框被認爲是禮貌的。否則,人們不得不花時間編寫自己的例子,有時這意味着人們提出的例子與您的真實案例有所不同,但某些方面您不會提及,這會讓所有人感到失望。 – DSM
謝謝你們。這是我的第一篇文章,所以我沒有意識到這一點。我剛剛編輯帖子以包含示例數據。 – MRA