我想打一個腳本,將從多個CSV文件複製第2列的文件夾中,並將其保存到一個CSV文件之前添加一些文字書寫。複製列,添加一些文本,並在新的csv文件
這裏就是我想要做的:從所有CSV文件
2)附加文本「Hello」 &「歡迎」在開始的每一行
1)在第2列中獲取數據並最終
3)將數據寫入到一個文件中
我試着用熊貓
import os
import pandas as pd
dataframes = [pd.read_csv(p, index_col=2, header=None) for p in ('1.csv','2.csv','3.csv')]
merged_dataframe = pd.concat(dataframes, axis=0)
merged_dataframe.to_csv("all.csv", index=False)
創建它
的問題是 -
在上面的代碼中,我不得不手動提的文件名,這是非常困難的,作爲一個解決方案,我需要包括所有CSV文件
*.csv
需要使用類似
writr.writerow(("Hello"+r[1]+"welcome"))
由於在每個文件中有多個csv文件,並且有很多行(大約100k),所以我需要加快速度。
下面是CSV文件的一個樣本:
"1.csv" "2.csv" "3.csv"
a,Jac b,William c,James
這裏是我怎麼想的輸出看all.csv:
Hello Jac welcome
Hello William welcome
Hello James welcome
任何解決方案使用.merge()
.append()
或.concat()
??
我怎樣才能做到這一點使用Python?
南希嗨。你可以像這樣獲得所有帶有模塊glob的csv文件:'paths = glob.glob('foo/*。csv')'。 –