2013-11-22 105 views
2

我想學習一點熊貓,所以我正在經歷一些R代碼,並試圖在Python中重現事物。PANDAS中的等效t檢驗結果?

我有以下簡單的例子

tempdat <- data.frame(unit=c('feet','feet','feet','feet','metres','metres','metres','metres'), 
        feet=c(50,45,75,60,26,32,40,45)) 
t.test(feet~unit, alternative='two.sided', conf.level=.95, var.equal=F, data=tempdat) 

我想這樣做在Python中同等功能,而這是我迄今爲止,但結果是不同的。

tempdat = pd.DataFrame({'unit':['feet','feet','feet','feet','metres','metres','metres','metres'], 'feet':[50,45,75,60,26,32,40,45]}) 
feet_group = tempdat[tempdat['unit']=='feet'] 
metres_group = tempdat[tempdat['unit']=='metres'] 
stats.ttest_ind(feet_group['feet'], metres_group['feet'], equal_var=False) 
+0

對不起 - 我衝到這個問題。我必須回去重做它 – crock1255

+0

相信我解決了這個問題 – crock1255

回答

0

在臉上的第一行錯誤: tempdat是蟒蛇內置字典。所以它必須有獨特的鍵。所以定義

tempdat={'feet':50,'feet':45,'feet':75,'feet':60,'metres':26,'metres':32,'metres':40,'metres':45} 

後,你將只有最後的值:

tempdat={'feet': 60, 'metres': 45} 

因此,測試結果不同