在不刪除的情況下統計變量中的重複觀察值* SAS *

我有一個年度患者索賠的數據集，每個病人每年可以有多個索賠（即：一個女性可以有兩個索賠聲稱如果她一年生兩次）。在不刪除的情況下統計變量中的重複觀察值* SAS *

我想統計每個患者ID重複的次數，但我不想消除重複或將其從數據集中取出。有沒有不同的代碼來做到這一點？

謝謝！

2015-02-11 lrk889

能描述一下你想要的結果？有很多方法可以做到這一點。你只是想要一個帶有頻率的報告，或者你想添加一個變量來計數患者ID的發生次數嗎？另外，你可以發佈你嘗試過的任何代碼嗎？ – DWal 2015-02-11 04:35:50

data work.claims_data; 
input patient_id $ claim_number $; 
datalines; 
P1 C1 
P1 C2 
P1 C3 
; 
run; 

proc sql; 
select patient_id,count(distinct claim_number) - 1 as cnt 
from claims_data 
group by patient_id 
having cnt > 0; 
quit;

工作：上面的SQL過程將爲患者明智地計算來自輸入數據集的不同索賠編號。如果我們從每個計數中減去1，則會給出每個患者的重複索賠計數。

輸出：

Patient_ID cnt 
     P1  2

來源

2015-02-11 06:42:00

具有變量名稱cnt的Count-1可能會誤導未來的用戶。 – Reeza 2015-02-11 14:38:13

在不刪除的情況下統計變量中的重複觀察值* SAS *

回答

相關問題