0
我有一個距離矩陣在手中,我想得到它的最大值,最小值,平均值,中值等值;預計describe()爲我做,但看起來像我錯了。 from scipy.stats import describe
和df.describe()
都可以在列或行上工作。 除了分別調用每種方法之外,還有什麼其他方法?如何描述整個矩陣或熊貓數據幀
我有一個距離矩陣在手中,我想得到它的最大值,最小值,平均值,中值等值;預計describe()爲我做,但看起來像我錯了。 from scipy.stats import describe
和df.describe()
都可以在列或行上工作。 除了分別調用每種方法之外,還有什麼其他方法?如何描述整個矩陣或熊貓數據幀
轉換2-d數據幀到一個1-d系列:
series = pd.Series(df.values.ravel())
然後調用series.describe()
。
例如,
In [24]: df = pd.DataFrame(np.random.random((5,4)))
In [25]: series = pd.Series(df.values.ravel())
In [26]: series.describe()
Out[26]:
count 20.000000
mean 0.514002
std 0.332819
min 0.001209
25% 0.298695
50% 0.528073
75% 0.804711
max 0.973840
dtype: float64
Doh! Facepalm:S – oztalha
@unutbu說什麼,或者也'''df.stack()描述()'''。這個時間稍短,我不知道這兩種方式總體上是優越的。 – JohnE
事實上,我有一個numpy矩陣,所以這樣做:'pd.Series(X.flatten())。describe()' – oztalha
@oztalha ravel不創建副本(我認爲flatten的確如此),所以應該是首選。 –