我目前使用熊貓和Python來處理大部分重複任務,我需要爲我的碩士論文完成。此時,我已經編寫了一些代碼(在堆棧溢出的幫助下),根據一個文件中的某些事件日期,找到在另一個文件中用作日期範圍的開始日期和結束日期。然後這些日期被定位並附加到一個空的列表中,然後我可以輸出到excel。但是,使用下面的代碼,我得到了一個有5列和400.000行的數據框(這基本上是我想要的),但不是我希望輸出的數據如何。下面是我的代碼:使用熊貓自動切片產品
end_date = pd.DataFrame(data=(df_sample['Date']-pd.DateOffset(days=2)))
start_date = pd.DataFrame(data=(df_sample['Date']-pd.offsets.BDay(n=252)))
merged_dates = pd.merge(end_date,start_date,left_index=True,right_index=True)
ff_factors = []
for index, row in merged_dates.iterrows():
time_range= (df['Date'] > row['Date_y']) & (df['Date'] <= row['Date_x'])
df_factor = df.loc[time_range]
ff_factors.append(df_factor)
appended_data = pd.concat(ff_factors, axis=0)
我需要的數據爲5列和250行(列是可變標識符)並排的,以便輸出,當它到excel我有,例如列AD,然後250每列的行數。這隨後需要重複列E-H等。使用ILOC,我可以定位使用appended_data.iloc[0:250]
250個觀察,與兩個5列和250行,然後將其輸出到Excel。
是任何方式對我的過程自動化,從而使選擇第一250和將其輸出到Excel之後,選擇下一個250並且將其輸出旁邊的第一250等?
我希望以上內容精確清晰,否則我很樂意詳細說明!
編輯:
以上圖片說明什麼,我得到輸出到Excel時; 5列和407.764行。我需要的是將這種拆分分解爲以下幾種方式:
第二張圖片說明了我如何將總樣本拆分。前五列和相應的250行需要作爲第二張照片。當我使用iloc [250:500]進行下一個分割時,我將得到接下來的250行,需要在最初的五列之後添加,等等。
如果我解釋這個正確的,你要使用具有250行和1600十歲上下的列單excel表格中結束了? –
基本上可以,大概是8000列左右,每列250列。前5列im描述涉及單個日期/觀察,因此列的總數應該是大約8000. –
您可以在您要查找的縮小版本中編輯嗎?在'df之後'說'3','20'之前說'''',在15之後'說4行' – EFT