我有大約50個Excel文件&我想導入到數據框併合並所有文件到單個數據框。 但有些文件有3個一些是4列。每個文件按不同順序排列成不同的列。從所有文件匹配列和追加到數據框,Python 3.6
總截然不同柱:5即COL1,COL2,COL3,COL4,COL5
我知道如何導入,但同時面臨着追加發行。
腳本:
dfAll = pd.DataFrame(columns=['col1', 'col2', 'col3', 'col4', 'col5')]
df= pd.read_excel('FilePath', sheetname='data1') # contains 3 columns i.e col1, col2, col5
columnsOFdf = df.columns
dfAll[columnsOFdf] = dfAll.append(df)
但它給錯誤 「ValueError異常:列必須是相同長度的關鍵」
我要追加DF [ 'COL1', 'COL2', 'COL5' ] data to dfAll ['col1','col2','col5']
請幫忙解決這個問題。
您試圖將大小爲3的數據框添加到大小爲5的數據框,這不適用於untype數據集 – Sentinel
@Sentinel,感謝您的答覆,任何備用解決方案? –
我沒有很好的引用python的dataFrames,你很可能需要創建一個新的數據框,只包括你想要的列,而不是附加其他數據框 – Sentinel