2017-10-05 68 views
0

我想要做的任務有點複雜,所以我會嘗試以最好的方式解釋它。使用熊貓合併csv文件(合併和複製)

我有以下格式在兩次CV文件:

CSV1:

 Name  Var2 Var3 
    John  6 7 
    John  7 8 
    Mike  5 6 

CSV2:

Name  Var4 Var5 
    John  8 8 
    John  9 9 
    Mike  1 1 
    Mike  2 2 

我基本上想要做的是合併的文件,但在以下格式:

Name Var2 Var3 Var4 Var5 
    John  6 7 8 8 
    John  6 7 9 9 
    John  7 8 8 8 
    John  7 8 9 9 
    Mike  5 6 1 1 
    Mike  5 6 2 2 

它實質上覆制了第一個csv中的每個Name條目,具體取決於第二個csv中有多少個相同的名稱條目,並添加了第二個csv中的相應列。我可以檢查csv1中的名稱是否與csv中的名稱匹配2,但是從那裏我不知道如何去了解它

+1

這是一個任務https://pandas.pydata.org/pandas-docs/stable/ generated/pandas.DataFrame.merge.html – MedAli

回答

2

您可以使用pd.merge

In [19]: df1 
Out[19]: 
    Name Var2 Var3 
0 John  6  7 
1 John  7  8 
2 Mike  5  6 

In [20]: df2 
Out[20]: 
    Name Var4 Var5 
0 John  8  8 
1 John  9  9 
2 Mike  1  1 
3 Mike  2  2 

In [21]: df1.merge(df2, how='right', on='Name') 
Out[21]: 
    Name Var2 Var3 Var4 Var5 
0 John  6  7  8  8 
1 John  7  8  8  8 
2 John  6  7  9  9 
3 John  7  8  9  9 
4 Mike  5  6  1  1 
5 Mike  5  6  2  2 
+0

我不敢相信它其實很簡單!非常感謝你! – Jethro

+0

@Jethro歡迎您:) – MedAli