0
我想比較兩個樣本之間的均值之差,由變量sample
在下面的大熊貓DataFrame
區分:調用在大熊貓數據幀的每一列的函數
import numpy as np
import pandas as pd
df = pd.DataFrame({'sample': np.random.choice([1, 2], 10, replace=True),
'x': np.random.uniform(size=100),
'y': np.random.normal(size=100),
'z': np.random.choice([1,5,7,3,9],100, replace=True})
進口
from scipy import stats
後
我想使用的功能
stats.ttest_ind(s1, s2, equal_var = False)
每一列上z
在df
使得s1=df['sample'==1, z]
對應於從樣品1的列的子集,並且s2=df['sample'==2, z]
對應於z
所述子集在樣品2
對於一個變量,我可以使用:
stats.ttest_ind(df.ix[df['sample']==1, 'x'], df.ix[df['sample']==2, 'x'], equal_var= False)
我正在尋找一種方法來一次對所有列執行此操作。我怎樣才能做到這一點?