檢查矩陣的每一行是否在另一個矩陣中[Python]

我有兩個矩陣（或更好的2D numpy陣列），A和B，列數相同（當然，行數，但我只是將兩個矩陣切成兩列），但行數不同。檢查矩陣的每一行是否在另一個矩陣中[Python]

我想檢查A中的每一行是否在B以及B中正確的行索引是什麼。其實，我自己用的是常規的循環，即

for r in range(A.shape[0]): 
    idx=numpy.where(numpy.all(B[:,[0,1]]==A[r,[1,2]],axis=1)) 
    idx=idx[0][0]

我如果有一些更聰明的方法來做到這一點，不知道使用索引方法，避免循環可能。我知道numpy的in1d，但它只適用於1D陣列。

對於熟悉Matlab的讀者，當'rows'選項被觸發時，我正在尋找ismember()行爲。

來源

2016-05-30 Alessiox

有什麼輸出格式？ – Divakar

@Divakar所需的輸出，如果可能的話，應該是一個數組（或列表），其中'*'第*行的行索引包含'A'的第*行*行。例如'[1,5,4]'的輸出列表意味着在'B'的第一行中找到'A'的第一行，在'B'的第五行中找到'A'的第二行在'B'的第四行找到第三行'A'。不過，我清楚地知道，在Python中，索引從0開始。 – Alessiox

您可以使用使用NumPy broadcasting一個量化的方法，像這樣 -

np.argwhere((B[:,None,[0,1]] == A[:,[1,2]]).all(-1))

或者，因爲你面對的只是2元素的行，即保持2D內存有效的方法，可以認爲，像這樣 -

np.argwhere((B[:,None,0] == A[:,1]) & (B[:,None,1] == A[:,2]))

輸出將是(N,2)形陣列，其中，所述第一列給出我們的B的行索引和的第二列對應於一行中所有元素的匹配。

採樣運行 -

In [154]: A[:,[1,2]] 
Out[154]: 
array([[0, 1], 
     [0, 2], 
     [2, 1], 
     [1, 2], 
     [0, 1]]) 

In [155]: B[:,[0,1]] 
Out[155]: 
array([[0, 1], 
     [2, 2], 
     [1, 2], 
     [0, 2], 
     [2, 1], 
     [2, 1], 
     [1, 0]]) 

In [156]: np.argwhere((B[:,None,[0,1]] == A[:,[1,2]]).all(-1)) 
Out[156]: 
array([[0, 0], 
     [0, 4], 
     [2, 3], 
     [3, 1], 
     [4, 2], 
     [5, 2]])

來源

2016-05-30 22:55:45 Divakar

這一個輝煌的解決方案。我會把它放在我的包裏。太糟糕了，對於大型矩陣來說是不切實際的。 – Alessiox

@Alessiox你的大型矩陣有多大？ – Divakar

目前我正在研究'A'大約200 MB和'B'大約10MB – Alessiox

檢查矩陣的每一行是否在另一個矩陣中[Python]

回答

相關問題