在Pandas中,如何創建一個列,該列是自「今日」以來「列日期」已失效的天數? 由於我的數據中存在重複的「文件」,因此我只需要最大日期。熊貓Python:如何從今天的列創建失效?
這裏是我的假設數據:
File,Status,Date
pafpull.sps,1,10-15-13 16:33
pafpull.sps,1,10-14-13 16:33
test.sps,1,10-14-13 11:19
目前代碼:
import pandas as pd
df = pd.read_csv(file, names=['File','Status','Date'])
df['Date']=pd.to_datetime(df['Date'])
xx=df.groupby('File')['Date'].max().order()
假設numpy 1.7; iirc可以通過np.timedelta64(1,'D')進行分割,即使在0.12(在0.13中也可以做一個astype),請參閱http://pandas.pydata.org/pandas-docs/dev/timeseries.html# time-deltas-conversions – Jeff
這非常有幫助。謝謝。 –