blas

    6熱度

    3回答

    我已經分配了一個大的雙向量,可以說有100000個元素。在我的代碼中,我想將所有元素設置爲一個常量,非零值。如何在不使用for循環遍歷所有元素的情況下執行此操作? 我也使用blas包,如果有幫助的話。

    0熱度

    1回答

    總之,我的問題是關於如何在Scalapack(BLACS)中的兩個不同處理網格上的兩個塊循環分佈矩陣之間實現矩陣副本。我試圖用pdgemr2d_來實現這一點,在其他情況下我經常使用它,在同一個流程網格上的兩個矩陣之間進行復制。 下面是我遇到的問題狀態的一個相當技術性的討論。我已經明白了一個基本問題,但是在我看來並不是一個解決方案......儘管必須有,但Scalapack明確指出我嘗試的操作類型是

    1熱度

    1回答

    僅使用gsl_blas_sgemm函數來測試所有1的乘法150x150矩陣。我得到了高達38的錯誤。爲什麼它不準確?

    2熱度

    2回答

    我正在嘗試使用CUBLAS來計算未知大小的兩個大矩陣。我需要一個完全優化的代碼(如果可能),所以我選擇不重寫矩陣加法代碼(簡單),而是使用CUBLAS,尤其是cublasSgemm函數,它允許A和C相加(如果B是單位矩陣):* C = alpha * op(A)* op(B)+ beta * c * 問題是:C和C++以行主格式存儲矩陣,cublasSgemm的目的是爲了Fortran兼容性,主要

    0熱度

    1回答

    如果一個矩陣是內存映射的,我需要讀取它並以塊的形式處理它,因爲它有點大,如何讀取它並在BLAS中逐塊處理它?

    10熱度

    1回答

    有沒有可以在OMF對象格式中爲Windows預編譯BLAS和LAPACK二進制文件的地方?我想將一些D語言代碼鏈接到這些代碼。我知道我在哪裏可以得到the relevant libs in COFF format。我也知道objconv工具,它將COFF轉換爲OMF,但由於我不完全理解的原因,這似乎不適用於實踐。這些似乎與符號中的下劃線有關,儘管我嘗試了幾乎所有處理這些問題的設置,但似乎沒有任何工

    0熱度

    4回答

    我想寫一個使用BLAS LIB來自R #include <stdio.h> #include <R.h> #include <R_ext/BLAS.h> void foo(int *dimension, double *vect1, double *vect2) { const int dim = dimension[0]; const int incxy = 1;

    6熱度

    1回答

    用CUDA實現矩陣乘法後。我試圖用CUBLAS來實現它(感謝這裏的一些人的建議)。 我可以乘以平方矩陣,但是(是的,再一次...)我在使用非平方矩陣時遇到了困難。當矩陣A的寬度(A * B = C)變化時,唯一適用的非矩形矩陣乘法就是這種類型。 我沒有得到任何錯誤,但由此產生的矩陣返回錯誤的值。這裏是我的代碼(它基本上是簡單的CUBLAS SDK示例的改編): #include <stdlib.h

    3熱度

    2回答

    我想在BLAS中使用python中的ctypes函數sgemm。試圖解決C = A X B下面的代碼工作得很好: no_trans = c_char("n") m = c_int(number_of_rows_of_A) n = c_int(number_of_columns_of_B) k = c_int(number_of_columns_of_A) one = c_float(1.0

    4熱度

    2回答

    我想使用Blas和Lapack庫來使用一些rutines,但是我不知道如何在Visual C++ 2010中使用它們。 如何在這種情況下使用它們?