2012-07-09 114 views
9

在MATLAB和Numpy中,數組都可以通過數組索引。但是,行爲是不同的。我來舉個例子來解釋一下。類似MATLAB的數組索引與Numpy

MATLAB:

>> A = rand(5,5) 

A = 

    0.1622 0.6020 0.4505 0.8258 0.1067 
    0.7943 0.2630 0.0838 0.5383 0.9619 
    0.3112 0.6541 0.2290 0.9961 0.0046 
    0.5285 0.6892 0.9133 0.0782 0.7749 
    0.1656 0.7482 0.1524 0.4427 0.8173 

>> A([1,3,5],[1,3,5]) 

ans = 

    0.1622 0.4505 0.1067 
    0.3112 0.2290 0.0046 
    0.1656 0.1524 0.8173 

numpy的:

In [2]: A = arange(25).reshape((5,5)) 

In [3]: A 
Out[3]: 
array([[ 0, 1, 2, 3, 4], 
     [ 5, 6, 7, 8, 9], 
     [10, 11, 12, 13, 14], 
     [15, 16, 17, 18, 19], 
     [20, 21, 22, 23, 24]]) 

In [6]: A[[0,2,4], [0,2,4]] 
Out[6]: array([ 0, 12, 24]) 

在詞:MATLAB選擇的行和列,numpy的 「拉鍊」 兩個索引陣列和使用該元組以指向條目。

如何獲得Numpy的MATLAB行爲?

回答

7

你可以這樣做:

A[[0,2,4],:][:,[0,2,4]] 

,這將給你想要的MATLAB般的結果。

值得意識到的是,相當不一致,如果你使用的切片進行索引,那麼你得到沒有任何這樣的兩輪牛車MATLAB樣的結果:

>>> A[1:3,1:3] 
array([[ 6, 7], 
     [11,12]]) 

在numpy的,不同於MATLAB,1:3不只是一個縮寫爲[1,2]或任何類型的。 (在這一點上,我覺得有必要提一下你一定已經知道的東西,即Python的1:3是有點像[1,2]而MATLAB的是有點像[1,2,3]:右手端點包括在MATLAB和排除在Python)

+3

這實際上是非常低效的。它需要在內存中創建一個臨時數組,這個數組可能會相當大,這取決於您正在使用的陣列的大小。有幾種更有效的方法可以做到這一點,包括使用ix_ helper函數。 – 2012-07-10 00:25:36

+2

是的,一切正確。另一方面,'ix_'構造的東西也很大,儘管是暫時的。我在原始問題中對5x5陣列做了一些時間實驗,結果如下。 '[,:] [:,]'比'[ix _()]'快25%,但是如果每次使用相同的索引,則使用'ix_'構造索引數組* *並重用它速度快大約10倍 - 儘管你當然會花費內存使用成本。 – 2012-07-10 11:38:17

+2

np.ix_在大多數情況下只使用少量的內存,因爲它返回其參數的視圖。 np.ix_也是一個常量時間操作,而A [I1,:] [:, I2]在時間和內存使用中都是〜n^2。但是如果你真的需要在你的5x5陣列上提高25%的性能,你必須做你應該做的事情。 – 2012-07-10 22:06:47

14

你可以使用輔助函數numpy.ix_得到了Matlab的行爲:

from numpy import ix_ 
A[ ix_([0,2,4], [0,2,4]) ] 
1

的有效途徑與numpy的做,這是重塑你的指數陣列相匹配的軸他們索引即

In [103]: a=numpy.arange(100).reshape(10,10) 

In [104]: a 
Out[104]: 
array([[ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9], 
    [10, 11, 12, 13, 14, 15, 16, 17, 18, 19], 
    [20, 21, 22, 23, 24, 25, 26, 27, 28, 29], 
    [30, 31, 32, 33, 34, 35, 36, 37, 38, 39], 
    [40, 41, 42, 43, 44, 45, 46, 47, 48, 49], 
    [50, 51, 52, 53, 54, 55, 56, 57, 58, 59], 
    [60, 61, 62, 63, 64, 65, 66, 67, 68, 69], 
    [70, 71, 72, 73, 74, 75, 76, 77, 78, 79], 
    [80, 81, 82, 83, 84, 85, 86, 87, 88, 89], 
    [90, 91, 92, 93, 94, 95, 96, 97, 98, 99]]) 

In [105]: x=numpy.array([3,6,9]) 

In [106]: y=numpy.array([2,7,8]) 

In [107]: a[x[:,numpy.newaxis],y[numpy.newaxis,:]] 
Out[107]: 
array([[32, 37, 38], 
     [62, 67, 68], 
     [92, 97, 98]]) 

與NumPy的廣播規則是你的朋友(所以比MATLAB更好)...

HTH