2016-02-29 47 views
0

我在下面的視圖中有一個數據集,並希望根據數據可用性和不同的匹配將一個唯一的id分配給一組記錄變量。根據sas中多個變量的查找值爲一組記錄分配一個唯一的標識

"Policy No" "Previous Policy No" "Next policy No" 
101 55 110 
110 101 201 
220 110 
511  532 
532 511 

預期的數據集:

"Customer Id" "Policy No" "Previous Policy No" "Next policy No" 
1 101 55 110 
1 110 101 201 
1 220 110 
2 511  532 
2 532 511 
+0

有點混亂。你能不能展示你所嘗試過的,並模擬出令人滿意的結果?請使用Ctl + K格式化代碼並用逗號分隔列名或將它們放在引號中。 –

+0

我相信這通常被稱爲鏈接查找問題。這裏有一個解決方案,但你的想法稍微複雜一點,http://support.sas.com/kb/25/029.html – Reeza

+0

@Reeza ..多數民衆贊成在解決方案,我在看..謝謝鏈接 – user3738411

回答

0

我不明白你的問題,但你可以通過使用MD5,並給它形成的關鍵變量生成一個唯一的ID。

例如:

data want; 
ID = PUT(MD5(CATS("Var1","Var2")),$HEX32.); 
PUT ID; 
RUN; 

結果:5BC449EDA5CF2BA878ABE53CB3955D38

該ID將是唯一的。您只需要決定您的業務密鑰並將其提供給MD5。做一些數據清理,例如,如果您的密鑰在大小寫不同的情況下可以提供所有變量,但不具有意義。

相關問題