2010-10-20 105 views
0

我有巨大的矩陣,我希望矩陣的輸出與輸入矩陣的大小相同,只是每個單元格從相鄰單元格中獲得數字的總和。GPGPU矩陣加法問題

您能指導我如何使用CUDA在GPGPU平臺上實現它嗎?

+3

什麼實施環境? OpenCL,Cuda,DirectX,OpenGL,DirectCompute,Matlab?除非你指定這個問題,我懷疑任何人都可以提供幫助。 – 2010-10-20 18:29:36

回答

1

您必須將所有相鄰單元格的值傳遞給您的內核(作爲參數),以便您可以完成總和。 像這樣在PARAMETERLIST和代碼右後: (INT actualCellvalue,INT ADJ1,INT ADJ2,INT ADJ3 ...)

{ actualCellvalue = actualCellvalue + ADJ1 + ADJ2 + ADJ3 ....; }

這可能是錯誤的,但多數民衆贊成我從你的真的簡短說明。

Regards, Peter