2015-02-11 222 views
0

我有一個年度患者索賠的數據集,每個病人每年可以有多個索賠(即:一個女性可以有兩個索賠聲稱如果她一年生兩次)。在不刪除的情況下統計變量中的重複觀察值* SAS *

我想統計每個患者ID重複的次數,但我不想消除重複或將其從數據集中取出。有沒有不同的代碼來做到這一點?

謝謝!

+0

能描述一下你想要的結果?有很多方法可以做到這一點。你只是想要一個帶有頻率的報告,或者你想添加一個變量來計數患者ID的發生次數嗎?另外,你可以發佈你嘗試過的任何代碼嗎? – DWal 2015-02-11 04:35:50

回答

0
data work.claims_data; 
input patient_id $ claim_number $; 
datalines; 
P1 C1 
P1 C2 
P1 C3 
; 
run; 

proc sql; 
select patient_id,count(distinct claim_number) - 1 as cnt 
from claims_data 
group by patient_id 
having cnt > 0; 
quit; 

工作:上面的SQL過程將爲患者明智地計算來自輸入數據集的不同索賠編號。如果我們從每個計數中減去1,則會給出每個患者的重複索賠計數。

輸出:

Patient_ID cnt 
     P1  2 
+0

具有變量名稱cnt的Count-1可能會誤導未來的用戶。 – Reeza 2015-02-11 14:38:13

相關問題