我不是一個統計人員,但必須處理相當一些數據。在大多數情況下,這些數據集來自在線調查;因此我有一個MySQL數據庫,並知道如何從中獲得一些結果。如何在Stata中通過語句(來自MySQL)創建一個組?
但是,現在我得到了一個Stata文件,我需要做一些分析。在MySQL中我會知道如何做到這一點,但是我陷入了Stata並尋求你的幫助。
我有一個不算小的表(大約50,000列)包含以下的列(有更多的cols但這些都是我一起工作的那些):
ID - 對象ID,唯一值
名稱 - 對象的名稱,爲字符串值
類 - 對象的類,整數範圍爲1 - 6
原點 - 對象的起源,整數範圍1 - 2
在50k行內,只有大約7k個不同的名稱。在Stata中,我可以用list name
找回所有的名字,甚至可以用list name if class == 2
將它限制在一個類中。
現在我想要一個所有不同名稱的列表以及具有該名稱的對象的計數,並且該列表按照計數排序。 在MySQL中,我會查詢SELECT name, COUNT(*) AS cnt FROM objects GROUP BY name ORDER BY cnt DESC
。 但是Stata會怎麼做呢?
接下來的步驟是爲每個班級或兩個來源獲得這樣的清單,即SELECT name, COUNT(*) AS cnt FROM objects WHERE class = 2 GROUP BY name ORDER BY cnt DESC
,Stata也可能有這樣的清單嗎?
ps:我不知道是否stackoverflow是正確的地方,因爲Stata不是真正的編程語言,是嗎?但是我在這裏發現了一些Stata相關的問題;這就是爲什麼我在這裏發佈它。如果有更好的地方可以這樣做,請將我指向正確的地方。
此答案有幫助嗎? HTTP://計算器。com/questions/6151020/how-to-aggregate-relational-data-in-stata –
這看起來絕對很有希望,但我最終得到了數千個新變量或數據集,我無法做任何事情。我仍然會嘗試去適應這一點。最後,我仍然需要做的就是將所有這些mX值相加。感謝您指出我的問題! – Paul
人們會問關於Stata的問題,但社區的專業知識有限。 Stata問題的第一站是statalist(http://www.stata.com/statalist/) – StasK