假設你有一個巨大的(40+ GB)特徵值(浮點)矩陣,行是不同的特徵,列是樣本/圖像。如何在內存映射一個巨大的矩陣?
該表是預計算列式。 然後它是完全訪問行和多線程(每個線程加載一整行)幾次。
什麼是處理這個矩陣的最好方法?我特別琢磨5點:
- 因爲它在一臺x64的PC上運行,我可以一次將內存映射到整個矩陣,但這樣做有道理嗎?
- 多線程(多線程初始計算呢?)的影響呢?
- 如何佈局矩陣:行或列主要?
- 在預計算完成後將矩陣標記爲只讀是否有幫助?
- 可以使用類似http://www.kernel.org/doc/man-pages/online/pages/man2/madvise.2.html的東西來加速嗎?
這個問題可能會因爲*太有趣而關閉 - 但我希望不會。操作系統是否有限制? (從鏈接猜測Linux) – 2011-01-29 20:41:28
我不明白爲什麼它可能會關閉,是否有一些規則我錯過了? 是的,該軟件目前僅限於Linux。但有關Windows的答案也是受歡迎的。 – Trass3r 2011-01-29 23:55:27