我有我通過閱讀使用numpy的製表符分隔文本文件中創建一個矩陣,它看起來是這樣的:過濾,分組,並計算統計numpy的矩陣數據
sample category_a category_b value
------ ---------- ---------- -----
1 A Z 3.92
2 A Y 12.43
3 B Z 5.87
4 B Y 6.71
etc...
我想過濾或對數據進行分組以執行一些基本統計數據,例如計算單個類別的每個值的平均值或類別的組合。不幸的是,我是Numpy的新手,在文檔中看不到任何明顯的這種類型的功能。是否可以按類別對矩陣數據進行分組並進行計算?或者當我從文件中讀取數據並進行計算時,是否需要過濾進入矩陣的數據?
可以過濾像數據這個:http://stackoverflow.com/questions/3030480/numpy-array-how-to-select-indices-satisfying-multiple-conditions 也有一些參考這裏的內置功能,也許其中一個功能你需要什麼:http://docs.scipy.org/doc/numpy/reference/routines.sort.html –
我建議你看看['pandas'](http://pandas.pydata.org/ )。 – BrenBarn
@BrenBarn:看起來它可能比基礎Numpy更適合我需要做的事情。謝謝! – woemler