我有一個從電子商店數據庫導出的4個csv文件,我需要按列合併它們,我可能會獨自完成這些操作。但問題是相匹配的右列合併csv列,同時檢查第一列的ID
第一個文件:
"ep_ID","ep_titleCS","ep_titlePL".....
"601","Kancelářská židle šedá",NULL.....
...
第二個文件:
"pe_photoID","pe_productID","pe_sort"
"459","603","1"
...
第三檔:
"epc_productID","epc_categoryID","epc_root"
"2155","72","1"
...
第四檔:
"ph_ID","ph_titleCS"...
"379","5391132275.jpg"
...
我需要所以用相同的「EP#ID」行「epc_productID」合併在一起的行和列具有相同的「ph_ID」匹配「 pe_photoID」了。我真的不知道從哪裏開始,希望我寫的理解
更新: 我使用:
files = ['produkty.csv', 'prirazenifotek.csv', 'pprirazenikategorii.csv', 'adresyfotek.csv']
dfs = []
for f in files:
df = pd.read_csv(f,low_memory=False)
dfs.append(df)
first_and_third =pd.merge(dfs[0],dfs[1],left_on = "ep_ID",right_on="pe_photoID")
first_and_third.to_csv('new_filepath.csv', index=False)
好此代碼的工作,但它以另一種方式比我更需要兩件事:
當在文件中的一個與ID的行= 1爲例,並在接下來的文件中的兩個有5行與BID = 1,則它產生5行詮釋最終文件我想在第二個文件中有一行將具有來自bID = 1的每行的多個值。可能嗎?
而且它似乎是刪除一些行...不知道,直到我擺脫了「重複」的...
使用其他軟件包或類似的東西時可以這樣做嗎? – Jakub