我使用Python csvkit
比較像這樣2個文件:熊貓 - 帶空格
df1 = pd.read_csv('input1.csv', sep=',\s+', delimiter=',', encoding="utf-8")
df2 = pd.read_csv('input2.csv', sep=',\s,', delimiter=',', encoding="utf-8")
df3 = pd.merge(df1,df2, on='employee_id', how='right')
df3.to_csv('output.csv', encoding='utf-8', index=False)
目前我通過手前的腳本,去掉從employee_id
列空間運行該文件。
的employee_id
一個例子:
37 78973 3
23787
2 22 3
123
有沒有辦法讓csvkit
做到這一點,拯救我的一個步驟?
'df1.employee_id = df1.employee_id.str.strip()' – Taylor
'read_csv'中的'skipinitialspace = True'怎麼辦? –