這是我今天開了SAS和我在看一些代碼,一個同事寫的第一次。SAS等同於R的is.element()
所以我們假設我有一些數據(import
)發生重複,但我只想要那些具有唯一編號名爲VTNR的數據。
首先她看起來獨特的數字:
data M.import;
set M.import;
by VTNR;
if first.VTNR=1 then unique=1;
run;
然後,她創建了一個表,被複制的數字:
data M.import_dup1;
set M.import;
where unique^=1;
run;
最後一個表,所有重複。 但在這裏,她真的是硬編碼的數字,因此,例如:
data M.import_dup2;
set M.import;
where VTNR in (130001292951,130100975613,130107546425,130108026864,130131307133,130134696722,130136267001,130137413257,130137839451,130138291041);
run;
我敢肯定,必須有一個更好的辦法。
由於我只熟悉R I會寫類似:
import_dup2 <- subset(import, is.element(import$VTNR, import_dup1$VTNR))
我想一定是這樣的$
也爲SAS?
看PROC排序與uniqueout和Dupout選項。 – Reeza
如果您需要SAS程序員的幫助,那麼您需要解釋您的R代碼的功能。你也應該解釋一下你用R代碼解決了什麼問題,而不僅僅是它如何工作。一般來說,當你使用不同的語言時,你需要調整你的方法。 – Tom