我想知道什麼是通過給定特徵來求和數組元素的最有效方法。例如,我有1000個數據的繪製,而我所尋找的是每個性別(特定年份)疾病的每個繪製(列)的總和(即,繪製是按性別,年份,疾病和我想要的每年和疾病的性別總和)。在Python中按特徵求和數組
import numpy as np
year = np.repeat((1980, 1990 , 2000, 2010), 10)
sex = np.array(['male', 'female']*20)
disease = np.repeat(('d1', 'd2', 'd3', 'd4', 'd5', 'd6', 'd7', 'd8'), 5)
draws = np.random.normal(0, 1, size=(sex.shape[0], 1000))
如何讓有跨越男女雙方戰平的某一年,疾病和數組,這將是形狀(20,1000)有什麼想法?我還需要能夠在數據不是完全平方的情況下做到這一點(有疾病年,只有1性)。
你見過熊貓圖書館http://pandas.sourceforge.net/?我對這件事不太瞭解,但前些天看到它,並認爲如果我曾經使用過標記的數據,那麼值得一看。 – tom10
查看接受的答案這是[SO問題](http://stackoverflow.com/questions/7169240/moving-large-sql-query-to-numpy/7170135#7170135)這是針對將SQL查詢轉換爲NumPy語法(你的Q中的查詢結構是在SQL「SUM ... WHERE ... ORDERBY ...,這是在這個評論鏈接到SO問題的查詢結構), – doug