我想從一個調查數據集中總結有用的信息。該數據集包含被調查個人父母的信息。一個ID將關聯四行,其中包含有關其母親,父親,岳母和岳父的信息。但是,我只對被調查的人感興趣,而不是他們的父母。如何彙總現有數據集中的有用信息併合併爲一個新數據集?
* Example generated by -dataex-. To install: ssc install dataex
clear
input str12 ID byte(parentID ca001)
"010104101002" 1 2
"010104101002" 2 1
"010104101002" 3 1
"010104101002" 4 1
"010104102002" 1 2
"010104102002" 2 2
"010104102002" 3 2
"010104102002" 4 1
"010104103001" 1 2
"010104103001" 2 2
"010104103001" 3 2
"010104103001" 4 1
"010104104001" 1 2
"010104104001" 2 2
"010104104001" 3 2
"010104104001" 4 1
"010104105002" 1 2
"010104105002" 2 2
"010104105002" 3 2
"010104105002" 4 2
end
label values parentID parent
label def parent 1 "1 Father", modify
label def parent 2 "2 Mother", modify
label def parent 3 "3 Father-in-law", modify
label def parent 4 "4 Mother-in-law", modify
label values ca001 ca001
label def ca001 1 "1 Yes", modify
label def ca001 2 "2 No", modify
例如,ca001
表示無論受訪者的父母(母親/父親/母親在法律/岳父岳母)還活着。我需要的是一個虛擬變量,表示仍然活着的ID父母的數量(0-4)。
我需要擺脫重複的ID,併爲一個觀察有一個唯一的ID。這是因爲我需要merge
此數據集與其他數據集通過匹配從一個數據集的唯一ID到另一個。
使用'dataex'(在Stata中,使用'ssc inst dataex'安裝)給出一個可讀的數據示例。不幸的是圖像沒有多大用處。 –
哦,thx ...我修改了我的問題,現在是否正確? –
它看起來不太好... tho –