如何將一列和一個矩陣組合成一個更大的具有`numpy`的矩陣？

我試圖通過對每一行做(X - means)/variance來規範矩陣。如何將一列和一個矩陣組合成一個更大的具有`numpy`的矩陣？

因爲我與MapReduce實現這一點，我先計算手段和每一列的標準方差，然後map每行有：

matrix.map(lambda X: (X - means)/variance)

但我想忽略每行X的第一個元素，這是我的目標列只包含1和0。

我該怎麼做？

來源

2012-12-24 satoru

如果A是形狀(m, n + 1)的numpy的陣列，你也有陣列mu和形狀(n,)的s2保持平均值和除了第一個的每一列的方差，就可以做你的歸一化，如下所示：

A[:, 1:] = (A[:, 1:] - mu)/s2

要展望笏繼續，您需要了解broadcasting如何工作。由於A[:, 1:]已經塑造(m, n)和mu和s2形狀(n,)，最後兩個都1S預先考慮到它們的形狀相匹配的第一個的尺寸，所以他們被視爲(1, n)陣列，並在算術運算的價值在他們的第一個也是唯一的行將廣播到到所有行。

如果你不這樣做，你的勁歌和方差陣列可以有效地計算

mu = (A[:, 1:].mean(axis=0) 
s2 = A[:, 1:].var(axis=0)

對於您可能希望使用np.std方差平方採取ddof參數的優勢，看到docs 。

單獨注意，normalization通常除以標準差而不是方差。

來源

2012-12-24 15:08:40 Jaime

謝謝。我知道'mean'和'var'方法，但我認爲它們只適用於小數據集。對於大型數據集，我必須用'MapReduce'來實現它們。在這種情況下，我需要「映射」一行，以便返回的「數組」被標準化（忽略第一列）。 – satoru

'np.concatenate（（X [0]，（X [1] - mean）/ std_var）'是我想要的;） – satoru

如何將一列和一個矩陣組合成一個更大的具有`numpy`的矩陣？

回答

相關問題