blas

    3熱度

    3回答

    在BLAS等級1中有* ASUM和* NRM2來計算矢量的L1和L2範數,但是如何計算矢量的(帶符號)和?有一些東西比填充另一個完整的矢量並且做一個* DOT更好...

    4熱度

    1回答

    我在Fortran 77中編寫了一些科學代碼,我正在討論什麼會更快。 基本上,我有一個m×n矩陣,讓我們稱之爲A. M是大於N.後來在的代碼,我需要乘以轉置(A)由一束載體。 我的問題是,這將是更快的採取,轉對我自己和存儲,或者當我打電話BLAS,只要給它轉置標誌? 謝謝! -Patrick

    1熱度

    2回答

    我完全被難住了。我有一個用c編寫的相當大的遞歸程序,它調用cblas_dgemm()。結果通過正常工作的程序獨立驗證。 C = alpha*A*B + beta*C 在使用隨機矩陣反覆試驗和的參數的所有可能的組合程序給出正確答案僅當ABS(測試版)= 2^N(1,2,4,8 ...)。任何值都適用於alpha。對於測試版,任何其他正面/負面,奇數/偶數值都會在10-30%的時間內給出正確的答案

    4熱度

    1回答

    我想在BLAS中對矩陣A和向量x執行簡單的就地操作A x \ to x。 sgemv向y提供一個A x + b y \,並調用A x + 0 x將給出不正確的結果。執行這個簡單任務的正確方法是什麼? trmv提供了適當的乘法,但只適用於三角矩陣。 矩陣不是很大,也許是64 * 64,但我有一個大約2^14的數組,並重復操作幾次。請注意,結構更復雜,然後A^n x:A取決於2^14數組中的位置和迭代

    6熱度

    2回答

    我想我已經在iPhone OS(iOS 4)中找到了一些寶石。 我發現有128位,256位,512位和1024位整數數據類型,由Accelerate Framework提供。此外,Apple還實施了基本線性代數子程序(BLAS),Apple實現LAPACK(線性代數包)和數字信號處理(DSP)子程序。 我很激動,因爲據我所知,BLAS和LAPACK是最好的(也是最有名的)圖書館。 (如果你從未聽過

    2熱度

    1回答

    我正嘗試在mpi和fortran中編寫一個簡單的差分方程求解器。我想我可能熟悉使用ATLAS/LAPACK/BLAS例程,因爲它們對於我可能做的任何未來的數字建模似乎都非常有用。我通過macports安裝了ATLAS。我使用gcc 4.4(也通過macports安裝)。 我大部分是自學的,並且從未使用過ATLAS,BLAS,LAPACK或任何「庫」(我已經在C++中使用過「include」語句或其

    4熱度

    1回答

    我想用cblas_dgemm()計算:C = 1*(A*B') + 0*C。 據我所知,參數是正確的。 錯誤消息本身沒有意義: "ldb must be >= MAX(K,1): ldb=3 K=3Parameter 11 to routine cblas_dgemm was incorrect" 但是,六味地黃丸= K = 3!以下是所有三個矩陣和參數的詳細輸出。 A: (m x n: 4x

    2熱度

    2回答

    我正在討論這個問題。我不能從以下乘法得到的結果: X^t * X X是m * n個矩陣,其中m = 36行和n =由一個utl_nla_array_dbl數據類型表示3列。數據源自表格並被簡單的pl/sql代碼複製。 爲了解決我的問題,我選擇了方法utl_nla.blas_gemm。這是一個矩陣矩陣方法,與utl_nla.blas_gemv作爲矩陣向量方法相反(我得到了一個矩陣向量方法,我能夠

    9熱度

    2回答

    有人可以推薦一個很好的參考或cblas接口教程?谷歌上沒有任何東西出現,我發現的所有手冊頁都是fortran blas界面的,而MKL附帶的PDF文件幾乎花了十秒鐘的時間搜索,並沒有什麼幫助。 特別是,我很好奇爲什麼有一個額外的參數行與列主要;轉置標誌不能完成相同的操作?看起來額外的參數只會增加已經存在容易出錯的界面的複雜性。

    6熱度

    2回答

    我一直在研究iOS 4中可用的加速框架。具體來說,我在C中的線性代數庫中做了一些嘗試以使用Cblas例程。現在我可以'不需要使用這些函數就可以在非常基本的例程中獲得任何性能提升。具體來說,是4×4矩陣乘法的情況。 float *mat4SetMat4Mult(const float *m0, const float *m1, float *target) { target[0] = m0