最近,我正在將SAS轉換爲Python熊貓。我有一個問題,大熊貓在SAS中是否具有保留功能。在python熊貓中保留函數並創建一個新表格作爲SAS
我的SAS代碼:
data df1;
retain col3 " ";
set df;
by ID ;
if first.ID then col3=col1;
else col3=col3;
其他條件我已經是在SAS代碼:
data df1;
retain col3;
set df;
by ID ;
if first.ID then col3=1;
else col3=col3+1;
如下所示 對此我試圖轉換
下一頁SAS代碼:
proc sql;
create table t1 as
select
c1, c2, c3, c4, c5, flag, max(flag) as MAX_flag
from t1
group by c1, c2, c3, c5;
run;
我在熊貓身上試過它,但看起來我犯了一些愚蠢的錯誤。如果有人知道如何複製sas代碼塊3到熊貓
t1=t1[['c1','c2','c3','c4','c5','c6']]
t1.loc[:,'Max_flag']=t1['flag'].max()
t1.groupby(['c1','c2','c3','c5'])
在我的例如。 col3是B,col1是a。 在其上它應該做的條件是 df.groupby([ 'ID'],as_index =假)。首先()
我有2列ID,A. 我的要求是輸入數據DF1:
ID A
1 a
1 b
2 c
1 p
2 q
輸出數據幀應該有一個列名稱爲B.它將按ID.first()進行分組。並將col A的數據複製到col B以獲得所有分組的ID。
輸出應該DF1
ID A B
1 a a
1 b a
2 c c
1 p a
2 q c
**My key requirement is to convert above SAS code to Pnadas**
能否請您提供輸入和輸出數據的例子嗎? –
輸入將像是表格10列有id列...我需要輸出數據應該包含11列與我們的新列中的值,即col_1 col_2。也沒有。的記錄在新的數據框中也必須相同。 – user07
您能否編輯您的問題並添加示例數據?它會使它更加可讀,並讓其他人更好地理解你問什麼。請參閱[這裏](http://stackoverflow.com/questions/20109391/how-to-make-good-reproducible-pandas-examples)關於如何做得更好的建議。 –