獲取前行的值，並計算新列熊貓蟒蛇

有沒有辦法回頭看從前一行，並計算出一個新的變量？所以只要前一行是相同的情況，（以前的變化） - （當前變化）是什麼，並將它歸入新列中的前一個'ChangeEvent'？獲取前行的值，並計算新列熊貓蟒蛇

這裏是我的數據框

>>> df 
    ChangeEvent StartEvent case    change  open 
0 Homeless Homeless  1 2014-03-08 00:00:00 2014-02-08 
1  other Homeless  1 2014-04-08 00:00:00 2014-02-08  
2 Homeless Homeless  1 2014-05-08 00:00:00 2014-02-08  
3  Jail Homeless  1 2014-06-08 00:00:00 2014-02-08  
4  Jail  Jail  2 2014-06-08 00:00:00 2014-02-08

添加列

Jail Homeless case 
0 6  1 
0 30  1 
0 0  1

...等等

這裏是DF構建

import pandas as pd 
import datetime as DT 
d = {'case' : pd.Series([1,1,1,1,2]), 
'open' : pd.Series([DT.datetime(2014, 3, 2), DT.datetime(2014, 3, 2),DT.datetime(2014, 3, 2),DT.datetime(2014, 3, 2),DT.datetime(2014, 3, 2)]), 
'change' : pd.Series([DT.datetime(2014, 3, 8), DT.datetime(2014, 4, 8),DT.datetime(2014, 5, 8),DT.datetime(2014, 6, 8),DT.datetime(2014, 6, 8)]), 
'StartEvent' : pd.Series(['Homeless','Homeless','Homeless','Homeless','Jail']), 
'ChangeEvent' : pd.Series(['Homeless','irrelivant','Homeless','Jail','Jail']), 
'close' : pd.Series([DT.datetime(2015, 3, 2), DT.datetime(2015, 3, 2),DT.datetime(2015, 3, 2),DT.datetime(2015, 3, 2),DT.datetime(2015, 3, 2)])} 
df=pd.DataFrame(d)

來源

2014-02-27 Chet Meinzer

的方式得到以前是美國ng移位方法：

In [11]: df1.change.shift(1) 
Out[11]: 
0   NaT 
1 2014-03-08 
2 2014-04-08 
3 2014-05-08 
4 2014-06-08 
Name: change, dtype: datetime64[ns]

現在您可以減去這些列。 注意：這是與0.13.1（日期時間的東西最近有很多工作，所以YMMV與舊版本）。

In [12]: df1.change.shift(1) - df1.change 
Out[12]: 
0  NaT 
1 -31 days 
2 -30 days 
3 -31 days 
4  0 days 
Name: change, dtype: timedelta64[ns]

您可以直接將此每個案件/組：

In [13]: df.groupby('case')['change'].apply(lambda x: x.shift(1) - x) 
Out[13]: 
0  NaT 
1 -31 days 
2 -30 days 
3 -31 days 
4  NaT 
dtype: timedelta64[ns]

來源

2014-02-27 23:04:08

你最後一次可以只是：''df.groupby（案例）[ '變'] DIFF（） ''（雖然我不認爲''diff''是cython化的，所以速度應該是一樣的 – Jeff

好極了，這正是我所需要的。 –

獲取前行的值，並計算新列熊貓蟒蛇

回答

相關問題