2016-05-05 74 views
0

我對使用概率權重(Stata中的權重)感到困惑,尤其是關於其用於RDD的問題。我就在這裏給出了一個答案跟進:模糊RDD和Stata權重問題

https://stats.stackexchange.com/questions/121750/fuzzy-rdd-issue

我明白,@Dimitri的例子/回答使用的0截止,並加上帶寬/減1線

gen w = max(0,1-abs(z))

給出在該帶寬之外的w爲0,並且爲恰好在該截止值的值給出1。

我的問題:不是pweight使用w的逆?即不是權重與我們想要達到的完全相反,通過賦予邊的高權重以及在截斷點周圍的觀察值爲零?我很困惑...

感謝您的幫助!

回答

1

我不認爲你對概率權重的理解是正確的。 Stata會用100以上的比例來衡量一個觀測值,而不是10。權重在某種意義上已經「倒置」了。

例如,參見下面的代碼:

#delimit; 
clear; 
set obs 2; 
gen y=100*(_n-1); 
gen w=10 in 1; 
replace w=100 in 2; 
list y w, clean noobs; 
reg y [pw=w]; 
gen x=_n; 
tw scatter y x [pw=w], ms(Oh); 

正如你可以看到,爲100 pweight第二觀察是在平均值計算更重要的,也是在圖中更爲突出。

+0

偉大 - 這是有道理的。我對相反的部分感到困惑。如果可以的話,我會投你的答案。謝謝! – andtie

+1

@andtie您可以通過單擊複選標記將其選爲答案。 –