因此,我嘗試尋找許多文章,解釋如何合併或連接,連接等工作的大熊貓在python,或只是一般的r。當我用我的數據進行測試時,似乎沒有任何工作需要。我將發佈帶有任意數字和標題的示例數據,這些數據和標題具有我的數據特徵,以及我希望它在最終產品中的外觀。我通常嘗試使用Genus作爲我的公共列,因爲該列具有最常見的信息,而所有其他列都是描述該列的信息。這些是文本文件。合併具有相同標題的列沒有重複的列
數據幀1:
Genus Data Facts Info
Dog 1 2 N/A
Cat 3 1 N/A
Elephant N/A 3 3
Pig N/A N/A N/A
Mouse N/A N/A N/A
數據幀2:
Genus Info Stats
Dog 2 3
Cat 1 2
Elephant N/A 1
Pig N/A N/A
Mouse N/A N/A
Bird N/A N/A
期望的結果:
Genus Data Facts Info Stats
Dog 1 2 2 3
Cat 3 1 1 2
Elephant N/A 3 3 1
Pig N/A N/A N/A N/A
Mouse N/A N/A N/A N/A
Bird N/A N/A N/A N/A
有什麼辦法來創建一個使用Python或R此結果?我對python和r很陌生,並不知道所有的細節,所以我可能會錯過某些東西或者沒有用正確的術語進行搜索,但我現在一直在嘗試大約3周的時間閱讀其他人爲類似的情況做了些什麼,並試圖從中解脫出來。我無法使用Excel,因爲它會自動將某些數字輸入更改爲日期,並執行其他小的更改,如果有人試圖重做它,他們可能不會意識到修復這些細微差別。
哦,所以在第是「情況」,「修補」是從df2中獲取信息並填充df1中的空間,同時仍然保留df2中不同的列和行? – dlevy987
太棒了!這真的很簡單嗎?我沒有在任何地方見過這個「df1.combine_first()」,我只見過.merge,.join和.concat,條件如通過= outer或一些其他複雜的東西,這些東西對我沒有意義新手自我。我非常欣賞這一點。它是否是numpy的一部分?因爲這可能是我以前從未見過的原因。這應該適用於更大的表格,更正嗎? – dlevy987
許多熊貓的東西都是在numpy特徵之後設計的。所以numpy Series和pandas DataFrame都提供了combine_first()方法。我在上面引入numpy的唯一原因是快速創建一些隨機數據框。我將從McKinney的文本中添加一個編輯,解釋組合和合並的選項。很高興這有助於。 –