2014-03-03 40 views
0

我有一個數據集,其中家庭標識(hhid)和成員標識(mid)標識一個唯一的人。我有兩次相隔一年的獨立調查結果(surveyYear)。我也有關於這個人當時是否入學的數據。Stata:需要幫助從面板數據創建二進制變量

我想要一個二元變量,如果所指的個人退出了調查之間的學校(即1,如果下降和0,如果還在上學)

我有塔塔有了深入瞭解這標誌着但這種編碼挑戰似乎有點超出我的意思,因爲我不知道如何比較後來的id與之前的id的校內狀態,然後將該結果傳播到二進制列中。

這裏是什麼,我需要

此前的例子:

 +----------------------------------+ 
    | hhid mid survey~r inschool | 
    |----------------------------------| 
    1. | 1  2   3   1 | 
    2. | 1  2   4   1 | 
    3. | 1  3   3   1 | 
    4. | 1  3   4   1 | 
    5. | 2  1   3   1 | 
    6. | 2  1   4   0 | 
    7. | 2  2   3   0 | 
    8. | 2  2   4   0 | 
    +----------------------------------+ 

後:

 +--------------------------------------------+ 
    | hhid mid survey~r inschool dropped | 
    |--------------------------------------------| 
    1. | 1  2   3   1   0 | 
    2. | 1  2   4   1   0 | 
    3. | 1  3   3   1   0 | 
    4. | 1  3   4   1   0 | 
    5. | 2  1   3   1   1 | 
    6. | 2  1   4   0   1 | 
    7. | 2  2   3   0   0 | 
    8. | 2  2   4   0   0 | 
    +--------------------------------------------+ 
+0

1985年前後,公司使用了「STATA」這個名字,但之後就不再使用了。無論您從何處獲取信息,都不知情! –

回答

1
bysort hhid mid (surveyyear) : gen dropped = inschool[1] == 1 & inschool[2] == 0 

的評論比碼長:

  1. hhidmid相同的觀測塊內,按surveyyear排序。

  2. 你想要在第3年但不是第4年inschool的學生。因此,inschool在第一次觀察中爲1,在第二次中爲0。

  3. 此處的下標[1][2]指的是由by:聲明定義的觀察塊內的順序。

如果需要更多細節, this article。請注意,與一個標籤相反,不需要循環(或者,如果您願意,可以將循環覆蓋到by:框架中)。