2015-04-27 43 views
0

我有一個距離矩陣在手中,我想得到它的最大值,最小值,平均值,中值等值;預計describe()爲我做,但看起來像我錯了。 from scipy.stats import describedf.describe()都可以在列或行上工作。 除了分別調用每種方法之外,還有什麼其他方法?如何描述整個矩陣或熊貓數據幀

+0

@unutbu說什麼,或者也'''df.stack()描述()'''。這個時間稍短,我不知道這兩種方式總體上是優越的。 – JohnE

+0

事實上,我有一個numpy矩陣,所以這樣做:'pd.Series(X.flatten())。describe()' – oztalha

+0

@oztalha ravel不創建副本(我認爲flatten的確如此),所以應該是首選。 –

回答

1

轉換2-d數據幀到一個1-d系列:

series = pd.Series(df.values.ravel()) 

然後調用series.describe()


例如,

In [24]: df = pd.DataFrame(np.random.random((5,4))) 

In [25]: series = pd.Series(df.values.ravel()) 

In [26]: series.describe() 
Out[26]: 
count 20.000000 
mean  0.514002 
std  0.332819 
min  0.001209 
25%  0.298695 
50%  0.528073 
75%  0.804711 
max  0.973840 
dtype: float64 
+0

Doh! Facepalm:S – oztalha