2014-06-29 43 views
0
結合觀察

(注:此數據集,完全是無中生有,幷包含任何個人或實體沒有實際的信息)我試圖在SAS

我有了下面的格式三個變量的數據集:

COV_ID   Adj_zip   Claim_info 

PSX0002915A  98216   A-20 

PSX0002915A  98216   T-14 

PSX0002920A  98216   A-16 

PSX0002902A  98216   T-08 

etc. 

除'Claim_info'外,所有觀察結果都重複。我需要的,如果claim_info觀察字母T.基本上我需要它看起來像這樣開始創建一個名爲technician_info,將舉行claim_info的信息,新的變量:

COV_ID   Adj_zip   Claim_info Technician_info 

PSX0002915A  98216   A-20   T-14 

PSX0002920A  98216   A-16   T-08 

我不完全怎麼問這個問題,所以我試圖提供一個例子。任何和所有的幫助將不勝感激。

回答

0

很多方法可以做到這一點。

這裏我把輸入數據分成A記錄和T記錄。然後我使用PROC SQL來加入表格。

如果您發現這需要很長時間,請告訴我,我可以調整爲適合您的運行速度。

data test; 
format COV_ID $12.; 
input COV_ID $ Adj_zip Claim_info $; 

datalines; 
PSX0002915A 98216 A-20 
PSX0002915A 98216 T-14 
PSX0002902A 98216 A-16 
PSX0002902A 98216 T-08 
; 
run; 

data As Ts; 
set test; 
if substr(claim_info,1,1) = 'A' then 
    output As; 
else if substr(claim_info,1,1) = 'T' then 
    output Ts; 
run; 

proc sql noprint; 
create table want as 
select a.cov_id, 
     a.adj_zip, 
     a.claim_info, 
     b.claim_info as Technician_info 
    from As as a 
     inner join 
     Ts as b 
    on a.cov_id = b.cov_id; 
quit; 
+0

這太好了。非常感謝。我沒有考慮將它們分成兩組數據。再次感謝你。 –