我想創建一個指示符變量「same_first_two_nearby」。這表明觀測的前兩個字符等於附近的觀測值。我嘗試使用「複製方法」,但我失敗了。因爲該方法只能「刪除」重複但不能保留。如何識別第一個流中具有相同字符的兩行
PROC SORT data=temp NODUPKEY;
BY customer_IN;
RUN;
我的數據的例子如下。
data temp;
input customer_IN $ 1-8 ;
cards;
ADJOHN.
ADMARY.
ADjerry.
BWABBY.
CFLUCY.
CFLINDA.
EFLAGNA.
KTPAKAO.
KTWANDA.
;
run;
proc print data=temp;run;
我想生成如下結果。
customer_IN same_first_two_nearby
ADJOHN. 1
ADMARY. 1
ADjerry. 1
BWABBY. 0
CFLUCY. 1
CFLINDA. 1
EFLAGNA. 0
KTPAKAO. 1
KTWANDA. 1
在此先感謝。
想下次檢查僅觀察到當前的觀察。或者你想檢查前兩個字母的相似性的所有觀察 –
我只想觀察當前的觀察結果。我先把它們分類。 –