用numpy初始化一個大矩陣的方式太長

我在python中工作，我遇到了一個問題：我必須初始化一個巨大的數組（21 x 2000 x 4000矩陣），以便我可以複製它的子矩陣。問題是我希望它非常快，因爲它是用於實時應用程序，但是當我運行numpy.ones（（21,2000,4000））時，創建此矩陣需要大約一分鐘的時間。當我運行numpy.zeros（（21,2000,4000））時，它是即時的，但只要我複製子矩陣，它需要一分鐘，而在第一種情況下，複製部分是即時的。用numpy初始化一個大矩陣的方式太長

有沒有更快的方式來初始化一個巨大的數組？

來源

2016-06-28 Okabe Kimtaro

*巨大*是你的關鍵詞，無論你做什麼，它都需要一段時間設置1.68億分，所以最好只做一次...... –

我認爲這種差異來自'numpy.zeros似乎創建了一個稀疏矩陣，比實際的矩陣要輕。因此，當您複製它時，它將創建實際的矩陣，這需要一分鐘，因爲它是一個巨大的矩陣（168M單元）。我認爲你不會有更快的方式來初始化這種尺寸的矩陣。 – ysearka

我想沒有更快的方法。您構建的矩陣非常大（8字節的float64 x 21 x 2000 x 4000 = 1.25 GB），並且可能佔用了系統中大部分物理內存;因此，等待的一分鐘可能是因爲操作系統必須將其他東西分頁以騰出空間。您可以通過在您分配內容並觀看內存使用和分頁時觀看top或類似內容（例如，系統監視器）來檢查。

numpy.zeros在您調用它時似乎是即時的，因爲內存是由操作系統懶洋洋地分配的。但是，只要您嘗試使用它，操作系統實際上必須在某處適合該數據。請參閱Why the performance difference between numpy.zeros and numpy.zeros_like?

您是否可以重構代碼，以便僅創建您打算複製的子矩陣，而不必創建大矩陣？

來源

2016-06-28 09:37:39 wildwilhelm

感謝您的澄清。可能不可能不使用巨大矩陣，這是一個包含21個通道的大圖像（實際上，深度學習中它實際上有21個類別，具有邏輯像素標記的概率）。子矩陣是神經網絡的輸出，它取決於層中輸入的步幅大小...... –

在這種情況下，正如@CSᵠ所述，您可能能夠在輸入之前預先分配矩陣進入您的應用程序的實時循環。如果您可以小心總是重新使用分配的內存，則只需等待一分鐘。 – wildwilhelm

如果我假設你正在分配'float64'，你也可以嘗試改變'dtype'。使用'float32'只需要640 MB，這可能會更快... – wildwilhelm

用numpy初始化一個大矩陣的方式太長

回答

相關問題