如何描述整個矩陣或熊貓數據幀

我有一個距離矩陣在手中，我想得到它的最大值，最小值，平均值，中值等值;預計describe（）爲我做，但看起來像我錯了。 from scipy.stats import describe和df.describe()都可以在列或行上工作。除了分別調用每種方法之外，還有什麼其他方法？如何描述整個矩陣或熊貓數據幀

來源

2015-04-27 oztalha

@unutbu說什麼，或者也'''df.stack（）描述（）'''。這個時間稍短，我不知道這兩種方式總體上是優越的。 – JohnE

事實上，我有一個numpy矩陣，所以這樣做：'pd.Series（X.flatten（））。describe（）' – oztalha

@oztalha ravel不創建副本（我認爲flatten的確如此），所以應該是首選。 –

轉換2-d數據幀到一個1-d系列：

series = pd.Series(df.values.ravel())

然後調用series.describe()。

例如，

In [24]: df = pd.DataFrame(np.random.random((5,4))) 

In [25]: series = pd.Series(df.values.ravel()) 

In [26]: series.describe() 
Out[26]: 
count 20.000000 
mean  0.514002 
std  0.332819 
min  0.001209 
25%  0.298695 
50%  0.528073 
75%  0.804711 
max  0.973840 
dtype: float64

來源

2015-04-27 02:16:41 unutbu

Doh！ Facepalm：S – oztalha

如何描述整個矩陣或熊貓數據幀

回答

相關問題