我有兩個數據集:SAS:PROC排序nodupkeys錯誤
- 「母親」 - 5512個觀測其中變量 「母親」= 1
- 「all_women」 - 2336750個觀測其中變量 「母親」 = 0
我將二者結合起來,如下所示:
data combined;
set mothers all_women;
現在作爲母親我已經在數據集all_women中,我想刪除重複的條目 - 條件是我保留觀察值,其中「MOTHER」= 1。
我試過如下:
proc sort data=combined; by ID DESCENDING MOTHER; run;
proc sort data=combined nodupkeys; by ID; run;
但我失去了一些母親因爲我只剩下5458觀察其中「MOTHER」 = 1。我做了什麼來介紹這個錯誤?
你確認「母親」有5,512個獨特ID嗎? – Jeff 2014-10-16 13:22:23
將兩個數據集合設置在一起並期望與第一個數據集相同數量的記錄似乎很奇怪,我希望在組合數據集中使用合併而不是SET。 – Reeza 2014-10-16 14:03:50