選項1
使用df.merge
out = df1.merge(df2, left_on='store', right_on='store_code')\
[['id', 'store', 'address', 'warehouse']]
print(out)
id store address warehouse
0 1 100 xyz Land
1 2 200 qwe Sea
2 3 300 asd Land
3 4 400 zxc Land
4 5 500 bnm Sea
選項2
使用pd.concat
和df.sort_values
out = pd.concat([df1.sort_values('store'),\
df2.sort_values('store_code')[['warehouse']].reset_index(drop=1)], 1)
print(out)
id store address warehouse
0 1 100 xyz Land
1 2 200 qwe Sea
2 3 300 asd Land
3 4 400 zxc Land
4 5 500 bnm Sea
第一次排序通話冗餘假設你的數據幀已經排序上store
,在這種情況下,你可以將其刪除。
選項3
使用df.replace
s = df1.store.replace(df2.set_index('store_code')['warehouse'])
print(s)
0 Land
1 Sea
2 Land
3 Land
4 Sea
df1['warehouse'] = s
print(df1)
id store address warehouse
0 1 100 xyz Land
1 2 200 qwe Sea
2 3 300 asd Land
3 4 400 zxc Land
4 5 500 bnm Sea
可替換地,顯式地創建的映射。如果您稍後想使用它,這將起作用。
mapping = dict(df2[['store_code', 'warehouse']].values) # separate step
df1['warehouse'] = df1.store.replace(mapping) # df1.store.map(mapping)
print(df1)
id store address warehouse
0 1 100 xyz Land
1 2 200 qwe Sea
2 3 300 asd Land
3 4 400 zxc Land
4 5 500 bnm Sea
我在類似數據集中運行.map代碼時出現此錯誤。 'Reindexing只對唯一有價值的索引對象有效' – Shubham
我認爲在'df2'的'store_code'中有重複的問題。所以需要'df1 ['store']。map(df2.drop_duplicates('store_code')。set_index('store_code')['warehouse'])' – jezrael
正確!謝謝 :) – Shubham