2017-02-09 60 views
0

我有一個熊貓數據幀像這樣:在Python中如何做多列比2個多變量之間的相關性?

id cat1 cat2 cat3 num1 num2 
1  0  WN  29  2003 98 
2  1  TX  12  755  76 
3  0  WY  11  845  32 
4  1  IL  19  935  46 

我想找出CAT1和列CAT3,NUM1與NUM2 或CAT1和NUM1與NUM2 或CAT2和CAT1,CAT3之間的相關性, NUM1,NUM2

當我使用df.corr()它給出了數據幀中的所有列之間的相關性,但我想看看上面詳述只是這些選擇性列之間的相關性。

我如何做到這一點在Python熊貓嗎?

千預先感謝您的回答。

+1

'DF [[ 'CAT1', 'CAT3']]。科爾()',等 – DyZ

回答

2

我嘗試了以下內容和它的工作:

features1=list(['cat1','cat2','cat3']) 
features2=list(['Cat1', 'Cat2','num1','num2']) 
df[[features1]].corr() 
df[[features2]].corr() 

好方法來選擇根據需要的列時,你有你的數據集非常高的變量。

相關問題