-3
我有一個向量V有nx1項目和矩陣M有nxm項目。我想用CUDA將M的所有列與V相加。 THRUST或CUBLAS中是否有任何方法可以幫助我解決問題?通過CUBLAS或THRUST在CUDA編程bsxfun?
我有一個向量V有nx1項目和矩陣M有nxm項目。我想用CUDA將M的所有列與V相加。 THRUST或CUBLAS中是否有任何方法可以幫助我解決問題?通過CUBLAS或THRUST在CUDA編程bsxfun?
在這裏,我有兩個向下票
thrust::device_vector<float> dummy_y(N,1);
alpha = 1.0f;
beta = 0.0f;
stat = cublasSger_v2(handle,K,N,&alpha,thrust::raw_pointer_cast(&dummy_y[0]),1,thrust::raw_pointer_cast(&A_sum_vec_d[0]),1,thrust::raw_pointer_cast(&C_d[0]),K);
我通過行向量,滿1秒乘以複製的列向量,如矩陣的大小和cublasSger
總結做什麼。 stat
保持代碼的執行狀態,您可以檢查是否有任何可能的錯誤。
你不應該在代碼中調用任何版本化的API函數。調用'cublasSger'不要'cublasSger_v2'。 – talonmies
是否有一點你會開始閱讀這些庫的文檔,或者你是否會一直問天真的問題,希望有人會爲你做所有的想法?您已經將此問題作爲您以前的「將我的Matlab代碼移植到CUDA」問題的一部分提出。 – talonmies
可能的重複[我如何找到行到推力或Cublas中兩個矩陣W和X之間的所有行距矩陣?](http://stackoverflow.com/questions/17351981/how-can-i-find-row-所有行距離矩陣之間的矩陣-w-和-x-in-t) – talonmies