2014-03-13 50 views

回答

7

好吧,看來並行化確實是通過使用高速LAPACK和BLAS替代品來實現的。在Ubuntu 12.04上,我使用軟件包管理器安裝了OpenBLAS,並從源代碼構建了Armadillo庫。 examples文件夾中的示例已構建並運行,我可以使用OPENBLAS_NUM_THREADS環境變量來控制核心數量。

我創建了一個小型項目openblas-benchmark,它可以測量Armadillo在計算矩陣積C = AxB時對各種大小矩陣的性能提升,但我目前只能在2核機器上進行測試。

對於大於512x512的矩陣,性能圖顯示執行時間減少將近50%。請注意,兩個軸都是對數的; y軸上的每個網格線表示執行時間加倍。 Performance plot

+0

我的不好;我在X軸上看不到對數刻度。 2x是2x,沒關係。如果我是你,我會再次檢查它是正確的答案:=} –

+0

我做了,謝謝:-)由於多項式複雜性的問題顯示爲圖中的直線並且指數可能是讀取曲線的導數。 – Svaberg

相關問題