我有一個數據集,其中每行是公司,年對,firmid
是一個字符串。Stata:使用egen組()創建唯一標識符
如果我做
duplicates drop firmid year, force
,因爲有沒有重複它不會刪除任何東西(我最初創建運行duplicates drop firmid year, force
後的數據集)。
到目前爲止這麼好。我想創建一個需要數字的firmid
的面板。所以我跑
egen newid = group(firmid)
xtset newid year
但'面板中重複的時間值'錯誤彈出。此外,
duplicates list newid year
列出了一大堆重複。
看起來好像egen, group()
沒有生成唯一的組。我的問題是:爲什麼,以及如何以穩健的方式創建獨特的羣組?
請問您可以發佈一個可重複的示例嗎?例如,使用最小數據輸入完成有問題的代碼來重新創建問題。請參閱'help input'來在do-file中創建簡短的示例數據。 –
你可以顯示重複的'firmid'嗎?當有重複時,查看所有三個變量將很方便。 –
另一種需要考慮的方法是編碼,參見[help](http://www.stata.com/help.cgi?encode)。 – StasK