作爲一本關於SPSS的小說,我正在努力尋找基於包含大約33,000個案例的數據集中的字符串變量的重複案例。查找重複的個案,字符串變量,SPSS
我有一個名爲「nr」的變量,應該是每個案例的唯一ID。但是,事實證明,某些情況下可能在輸入的「nr」中有兩個不同的值,唯一的區別是最後一個字符。導致一個案例顯示爲兩個單獨的行。
var「nr」的結構如下:XX-XXXXXXX-X或X-XXXXXXX-X,即2-7-1個字符或1-7-1個字符。
我想對所有具有「nr」等於除最後一個字符之外的其他情況的情況進行排序。
爲了說明,具有succesfull語法我希望能夠像這些案件進行從整個數據集進行排序:
20-4026988-2
20-4026988-3
5-4026992 -5
5-4026992-8
20-4027281-2
20-4027281-3
任何人有關於如何爲此創建語法的想法?會很感激任何輸入!