我正在嘗試爲一個相當大的數據集(3m個觀察值)編寫代碼,該數據集已被分成更小的組(ID)。對於每個觀察結果(如下表所示),我想爲排在我以下的所有觀測值創建一個變量「值」的累計和,但要根據排名較低的觀測值等於我的條件。Stata代碼有條件地總結基於組別的數值
[
我想寫這個代碼不使用循環,如果有一種方法可以做到這一點。 有人可以幫我嗎?
謝謝!
更新: 我粘貼了以下輸出變量的等式。
更新2: 上表中的CSV格式爲:
ID,Rank,Condition,Value,Expected output,,
1,1,30,10,0,,
1,2,40,20,0,,
1,3,20,30,0,,
1,4,30,40,10,,
1,5,40,50,20,,
1,6,20,60,30,,
1,7,30,70,80,,
2,1,40,80,0,,
2,2,20,90,0,,
2,3,30,100,0,,
2,4,40,110,80,,
2,5,20,120,90,,
2,6,30,130,100,,
2,7,40,140,190,,
2,8,20,150,210,,
2,9,30,160,230,,
我完全不能效仿這個例子。指導我們如何通過(例如)0,0,10,20,30,80如何遵循您的ID爲1的規則。 –
謝謝尼克!我用等式更新了這個問題。 – SreeVathsan