0
我有一個年度患者索賠的數據集,每個病人每年可以有多個索賠(即:一個女性可以有兩個索賠聲稱如果她一年生兩次)。在不刪除的情況下統計變量中的重複觀察值* SAS *
我想統計每個患者ID重複的次數,但我不想消除重複或將其從數據集中取出。有沒有不同的代碼來做到這一點?
謝謝!
我有一個年度患者索賠的數據集,每個病人每年可以有多個索賠(即:一個女性可以有兩個索賠聲稱如果她一年生兩次)。在不刪除的情況下統計變量中的重複觀察值* SAS *
我想統計每個患者ID重複的次數,但我不想消除重複或將其從數據集中取出。有沒有不同的代碼來做到這一點?
謝謝!
data work.claims_data;
input patient_id $ claim_number $;
datalines;
P1 C1
P1 C2
P1 C3
;
run;
proc sql;
select patient_id,count(distinct claim_number) - 1 as cnt
from claims_data
group by patient_id
having cnt > 0;
quit;
工作:上面的SQL過程將爲患者明智地計算來自輸入數據集的不同索賠編號。如果我們從每個計數中減去1,則會給出每個患者的重複索賠計數。
輸出:
Patient_ID cnt
P1 2
具有變量名稱cnt的Count-1可能會誤導未來的用戶。 – Reeza 2015-02-11 14:38:13
能描述一下你想要的結果?有很多方法可以做到這一點。你只是想要一個帶有頻率的報告,或者你想添加一個變量來計數患者ID的發生次數嗎?另外,你可以發佈你嘗試過的任何代碼嗎? – DWal 2015-02-11 04:35:50