1
這兩種關係有可能有所不同嗎?pandas spearman相關性很奇怪嗎?
大熊貓版本0.18.1
from pandas import Series
a = ['Arsenal', 'Leicester', 'Man City', 'Tottenham', 'Crystal Palace']
b = ['Arsenal', 'Leicester', 'Man City', 'Tottenham', 'Man United']
c = ['Arsenal', 'Leicester', 'Man City', 'Tottenham', 'Man United']
d = ['Arsenal', 'Leicester', 'Man City', 'Tottenham', 'West Ham']
Series(a).corr(Series(b), method="spearman")
0.69999999999999996
Series(c).corr(Series(d), method="spearman")
0.8999999999999998
python 3.5.2和anaconda 4.4.1 –
熊貓必須以某種方式排列這些字符串,因此它們按字母順序排列。因此,根據其他球隊的存在情況,球隊的排名可能會有所不同。所以熊貓正在計算「正確」,但這不是你想要的操作。 –
我不是統計學家,但不需要在兩個數字系列上完成相關性?你期待什麼作爲輸出?在熊貓0.19.2上面的示例代碼崩潰,因爲字符串不是浮動的。 – nico