matrix-multiplication

    2熱度

    1回答

    如果M是一個密集的m×n矩陣並且v是一個n分量向量,那麼產品u = Mv是由u[i] = sum(M[i,j] * v[j], 1 <= j <= n)給出的m分量向量。一個簡單的實現該乘法是 allocate m-component vector u of zeroes for i = 1:m for j = 1:n u[i] += M[i,j] * v[j] e

    0熱度

    1回答

    我想在C++中編寫一個函數,它將兩個已經動態分配的矩陣A,B相乘。我目前正試圖讓乘法代碼工作,然後我會嘗試把它變成一個函數。現在我正在得到各種各樣的錯誤; 「分段故障(核心轉儲)」。我已經縮小到了代碼的乘法部分,但我不知道它有什麼問題。有人能幫助我嗎?我的代碼如下所示。 #include <iostream> #include <cassert> int main()

    3熱度

    1回答

    我想使用dgemm或任何其他lapack/blas函數將矩陣A的子集乘以另一個矩陣。我認爲,由於子矩陣的元素可能不是連續的,我不能直接使用dgemm而不將子矩陣複製到另一個空間。所以,當這個子矩陣本身很大時,我認爲在C中爲這個特定問題編寫乘法代碼可能會更好,因此效率可能非常低。由於複製並使用lapack/blas本身,可能效率不高。我在matlab中使用lapack/blas作爲mex文件。 我的

    -2熱度

    2回答

    我有一段可怕的時間試圖做這個看似簡單的函數。我不明白爲什麼這不起作用。 我的代碼: C = matrix(0 , dim(matrixA)[1] , dim(matrixB)[2] , TRUE) mat_mult = function(matrixA, matrixB){ for (ii in 1:dim(matrixA)[1]) { for (jj in 1:dim(matrix

    2熱度

    1回答

    我有兩個關於glsl效率的問題。 在完全用戶定義着色器管線 VS - > TCS - > TES - > GS - > FS 第一4個階段都能夠被用於這樣的操作: gl_Position = MPV_matrices * vec4(in_pos, 1); 哪個階段更有效率呢?它是硬件還是版本相關? 有關使用GLSL是示出了正在傳遞的着色器之間的頂點位置,而不是使用內置變量僅gl_Positio

    0熱度

    1回答

    我有兩個等級爲3的張量,換句話說就是兩個3D矩陣。我想要拿這兩個矩陣的點積。我很困惑繼續這個問題。幫助我用公式來做到這一點。

    -2熱度

    1回答

    我有一個簡單的結構「mat4」,由float [4] [4]和* =組成,用於乘以4x4矩陣。這需要一個const MAT4 &「RHS」如下: this->m[0][0] = this->m[0][0] * rhs[0][0] + this->m[0][1] * rhs[1][0] + this->m[0][2] * rhs[2][0] + this->m[0][3] * rhs[3][0];

    1熱度

    1回答

    我已經看了一些答案的矩陣乘法(如R: matrix by vector multiplication)乘以矩陣向量但仍無法找到答案,我的問題: 我賣的四種類型的水果,用每個項目的價格在這個載體: prices <- c(2.25, 0.42, 0.85, 1.24) names(prices) <- c("pomegranate", "banana", "apple", "mango") >

    0熱度

    1回答

    我使用Spark 1.6與YARN,我有一個工作,使用Spark mllib做一些計算,其中之一是矩陣乘法,我使用CoordinateMatrix來做。該代碼是這樣的: def coordinateMatrixMultiply(leftMatrix: CoordinateMatrix, rightMatrix: CoordinateMatrix): CoordinateMatrix = {

    0熱度

    2回答

    您好,我是MPI編程新手。我試圖將兩個矩陣相乘(一個NxN矩陣(A)和一個Nx1(B)矩陣)以得到一個結果C矩陣(Nx1)。每個進程都應該計算矩陣C中的一行(元素),但只有進程0(我的主進程)可以正確計算,因爲它似乎沒有等待其他進程完成計算。我也不確定非主過程是否正確地發回結果(或者他們甚至需要?)。這裏是我的代碼: #include <stdio.h> #include <stdlib.h>