與一個變量和許多其他變量的相關性

在Stata中，有沒有一種快速顯示變量和一串假人之間相關性的方法。在我的數據中，我有一個自變量，goals_scored在一個遊戲中，以及一個stadium的傻瓜玩。我怎麼能在一張表中顯示goals_scored和i.stadium之間的相關性，而沒有得到體育場館之間的相關性，我不關心。與一個變量和許多其他變量的相關性

來源

2013-02-03 CJ12

你只想知道一些體育場是否有系統的更高的進球？ –

我很想嘗試poisson迴歸：poisson goals_scored i.stadium，nocons robust。指數化的參數（即e^b）會告訴你在該體育場中比賽的預期目標數量。您可能會在交叉驗證的網站上提出這個問題作爲一個單獨的問題。確保更精確地描述你的數據（可能會發布一些示例行）。 –

這裏有一種方法：

#delimit;  

quietly tab stadium, gen(D); // create dummies 

foreach var of varlist D* {;  
    quietly corr goals_scored `var'; 
    di as text "`: variable label `var'': " as result r(rho); 
}; 

drop D*; // get rid of dummies

來源

2013-02-04 00:56:46

如果您將所有的體育場變量存儲在本地，您可能會通過循環來拉取相關性。

來源

2013-02-03 23:55:51 RickyB

有沒有辦法做到這一點，而不列出每個變量？我有超過100個場館。 – CJ12

他們是否有類似的命名約定？然後，您可以使用通配符，如「stadium_ *」，用於體育場1，體育場2，體育場3 ...等。 – RickyB

或者，如果您知道數據集中的所有變量都緊挨着，您可以指定列號範圍，我相信。 – RickyB

1. 如果所有球場變量相鄰放置的其它數據集中：

foreach s of varlist stadium1-stadium150 { 
    // do whatever 
}

2A。如果體育場變量不相鄰，請使用order去那裏。

2b。如果變量名稱遵循一個模式，則可能有另一種解決方法。

3. 我不會爲此使用相關性。根據目標的分佈情況，我會考慮其他事情。

來源

2013-02-04 01:02:44

我只是看着目標隨體育場而變化。你會建議什麼？ – CJ12

我會建議在進一步編碼之前查看目標的分佈情況！恐怕尼克是對的：技術答案已經存在（並且我們不可能知道哪些答案最好，而無需查看數據），並且在您的問題中存在一個更爲普遍的問題，即CrossValidated。 –

cpcorr來自SSC（與ssc inst cpcorr一起安裝）支持最小的相關表，即只有一個集合與另一個集合之間沒有其他集合的相關性。但它是一箇舊的程序（2001），並且不直接支持因子變量。指標變量（也叫虛擬變量）必須先存在。

來源

2013-02-04 01:59:04

我不明白答覆。你想要一個快速的方法來計算相關性，'cpcorr'是一個。在內部它是一個循環變量，不可避免地，所以這個答案與其他類似。順便說一句，現在有關您最近打開的幾個主題的開放建議和問題。良好的協議是你通過接受答案來關閉線索，或通過解釋爲什麼答覆是錯誤的或者不是你想要的。我正在對你的問題進行投票。它變成：你提出了什麼？在這個論壇上回答的問題太籠統了。 –

與一個變量和許多其他變量的相關性

回答

相關問題