我想在特定列的proc sql
語句中使用select distinct
。我有大約10列,我不想檢查整個10列的重複,我只想檢查一列的重複。嘗試在特定列的Proc Sql語句中選擇不同
所以,當我寫的proc sql
像下面,select distinct
檢查過所有10列的重複:
proc sql;
create table newtable as
select distinct Col1, Col2, Col3, Col4, ... , Col10 from oldtable;
quit;
我試着寫類似下面檢查重複僅爲COL3,太添加其他列進入新表格。但它失敗了。我也嘗試過不同的組合,例如在from oldtable
之後添加新的select distinct Col3
,但所有組合均失敗。那麼訣竅是什麼?
proc sql;
create table newtable as
select (distinct Col3), * from oldtable;
quit;
問題是我從前面的左連接過程中得到了「重複」,這意味着輸入表就像1000行,而輸出表就像1100行。我期望輸出表格也是1000行,但顯然有些行在左連接後保存了兩次(這就是我稱之爲重複的原因)。 我只想根據只有一列刪除下一步中的重複行。 – user3714330
聽起來像你需要修復左連接過程。 – Joe
,我試圖在左連接過程的前一步中實現'select distinct',但它不起作用。 但是我會檢查'group by',如果它可以幫助我在LEFT加入過程中 – user3714330