我的DataFrame有一個索引SubjectID,並且每個Subject ID都有它自己的目錄。在每個主題目錄中都有一個.csv文件,其中包含要放入我的DataFrame中的信息。使用我的SubjectID索引,我想讀取每個主題的.csv文件的標題,並將其放入我的DataFrame中的新列。從不同目錄讀取多個.csv文件到熊貓DataFrame
除了個別主題號碼,每個主題目錄具有相同的路徑。
我已經找到了從單個目標目錄中讀取多個.csv文件到熊貓數據框的方法,但不能從多個目錄中讀取。下面是一些代碼,我有一種從目標目錄導入多個.csv檔案來:
subject_path = ('/home/mydirectory/SubjectID/')
filelist = []
os.chdir('subject_path')
for files in glob.glob("*.csv") :
filelist.append(files)
# read each csv file into single dataframe and add a filename reference column
df = pd.DataFrame()
columns = range(1,100)
for c, f in enumerate(filelist) :
key = "file%i" % c
frame = pd.read_csv((subject_path + f), skiprows = 1, index_col=0, names=columns)
frame['key'] = key
df = df.append(frame,ignore_index=True)
我想要做類似的事情,但反覆進入不同主題的目錄,而不是具有單一目標目錄。
編輯: 我覺得我要做到這一點使用os
不pandas
,有沒有使用循環使用os
通過多個目錄搜索的方法嗎?
上面的代碼是什麼,我已經嘗試了從單一的目錄中導入的.csv,問題是,我不是確定如何適應這個從多個目錄導入文件。 – MScar
也許使用循環並搜索多個主題路徑? –
我想用'os'來做這個嗎?這看起來不像是可以在熊貓中完成的 – MScar