2008-11-25 38 views

回答

4

BLAS的性能非常依賴於系統,所以你最好在你想使用的機器上自己做基準測試。由於只有少數幾個BLAS實現,所以它的工作量比聽起來要少(通常爲hardware vendors implementation,ATLASGOTO BLAS)。

但請注意,BLAS只覆蓋稠密矩陣,所以對於稀疏矩陣乘法,您需要Sparse-BLAS或其他代碼。這裏的性能不僅取決於硬件,而且取決於你想要使用的稀疏格式,甚至不同的矩陣類型(稀疏模式,帶寬等等)。因此,即使在密集的情況下,如果您需要最高的性能,您也需要做自己的基準測試。

+0

我試圖在Linux系統上對英特爾Math Kernel Library進行基準測試,並遇到只適用於特定版本的gcc的問題。僅此一件事就花了我一天的工作。另一方面,我不知道性能增益在哪個數量級上...... – 2009-01-06 20:00:42