我有兩個數據框。第一個是這樣的:如何在大熊貓中對齊dfs
idx token tag file
0 This AA file_1.1
1 is AA file_1.1
2 a AA file_1.2
第二個是這樣
file
file_1.1 IXX GXX
file_1.2 AXX
file_1.3 AXX
如何加入兩個,讓我具備以下條件:
idx token tag file ID
0 This AA file_1.1 IXX
1 is AA file_1.1 GXX
2 a AA file_1.2 AXX
所以,首先我需要通過文件列對齊(我可以做到這一點),然後如果一行有一個ID我不得不將它添加到ID列,如果它有多個,將它添加到第一個令牌,第二個添加到第二個令牌等。我永遠不會有比每行代碼更多的ID。
我嘗試以下
pandas.concat([df1,df2],axis=1,join_axes=[df1.index])
但它不工作。
第二個列是什麼? 'IXX'屬於哪一列? –
這些是未命名的。如果有東西被分離。大多數列只包含一個項目。至多我每行有6個項目。 – Angelo
可以試試'df2.columns.values'併發布解決方案 – WoodChopper