2013-02-03 69 views
0

在Stata中,有沒有一種快速顯示變量和一串假人之間相關性的方法。在我的數據中,我有一個自變量,goals_scored在一個遊戲中,以及一個stadium的傻瓜玩。我怎麼能在一張表中顯示goals_scoredi.stadium之間的相關性,而沒有得到體育場館之間的相關性,我不關心。與一個變量和許多其他變量的相關性

+1

你只想知道一些體育場是否有系統的更高的進球? –

+0

我很想嘗試poisson迴歸:poisson goals_scored i.stadium,nocons robust。指數化的參數(即e^b)會告訴你在該體育場中比賽的預期目標數量。您可能會在交叉驗證的網站上提出這個問題作爲一個單獨的問題。確保更精確地描述你的數據(可能會發布一些示例行)。 –

回答

2

這裏有一種方法:

#delimit;  

quietly tab stadium, gen(D); // create dummies 

foreach var of varlist D* {;  
    quietly corr goals_scored `var'; 
    di as text "`: variable label `var'': " as result r(rho); 
}; 

drop D*; // get rid of dummies 
0

如果您將所有的體育場變量存儲在本地,您可能會通過循環來拉取相關性。

+0

有沒有辦法做到這一點,而不列出每個變量?我有超過100個場館。 – CJ12

+0

他們是否有類似的命名約定?然後,您可以使用通配符,如「stadium_ *」,用於體育場1,體育場2,體育場3 ...等。 – RickyB

+0

或者,如果您知道數據集中的所有變量都緊挨着,您可以指定列號範圍,我相信。 – RickyB

0

1. 如果所有球場變量相鄰放置的其它數據集中:

foreach s of varlist stadium1-stadium150 { 
    // do whatever 
} 

2A。 如果體育場變量不相鄰,請使用order去那裏。

2b。 如果變量名稱遵循一個模式,則可能有另一種解決方法。

3. 我不會爲此使用相關性。根據目標的分佈情況,我會考慮其他事情。

+0

我只是看着目標隨體育場而變化。你會建議什麼? – CJ12

+0

我會建議在進一步編碼之前查看目標的分佈情況!恐怕尼克是對的:技術答案已經存在(並且我們不可能知道哪些答案最好,而無需查看數據),並且在您的問題中存在一個更爲普遍的問題,即CrossValidated。 –

1

cpcorr來自SSC(與ssc inst cpcorr一起安裝)支持最小的相關表,即只有一個集合與另一個集合之間沒有其他集合的相關性。但它是一箇舊的程序(2001),並且不直接支持因子變量。指標變量(也叫虛擬變量)必須先存在。

+1

我不明白答覆。你想要一個快速的方法來計算相關性,'cpcorr'是一個。在內部它是一個循環變量,不可避免地,所以這個答案與其他類似。順便說一句,現在有關您最近打開的幾個主題的開放建議和問題。良好的協議是你通過接受答案來關閉線索,或通過解釋爲什麼答覆是錯誤的或者不是你想要的。我正在對你的問題進行投票。它變成:你提出了什麼?在這個論壇上回答的問題太籠統了。 –

相關問題