我有兩個數據集(d1和d2),我想根據個別特定標識符(ind_ID)進行合併。問題是有些情況下,一個或兩個數據集中出現兩次相同的ind_ID(其他字段不同)。SAS合併重複觀察
我在d1中選擇一個重複項以合併兩個重複項在d2中,但我不確定如何告訴SAS只選擇d1中的一個觀察值並將它合併到d2中。我是這樣做的,因爲我還沒有被告知哪個觀察結果是正確的,我希望繼續我的編碼,直到信息進入。
到目前爲止,我嘗試了基於合併貸款編號(第一個示例代碼)以及使用合併標識符(第二個示例代碼)。似乎兩者都有相同的結果,並且SAS只是隨機選擇重複項中的哪個ind_ID與哪個重複項合併。
缺少手動檢查數據和刪除不想合併的觀察值,有沒有辦法做到這一點?
data merge_test;
merge d1 d2;
by ind_ID;
run;
data merge12;
merge d1(in=a) d2(in=b);
by ind_ID;
if a and b;
mergecheck = compress(a||b);
run;