gpu-programming

    2熱度

    1回答

    我很感興趣地沿着樣條線路徑地圖幾何......例如採取每個頂點的z值沿花鍵的距離,並得到當地XY軸處的那個點花鍵。樣條由許多部分構成,每個部分由x/y/z的三次方程描述,例如x(t)= at^3 + bt^2 + ct + d,所以每個部分可以很好地由矩陣或幾個float4值。 但由於樣條可以很容易地有100段,這意味着400-1000個float4值的數組着色器從工作。作爲一個新手程序員GPU這

    0熱度

    2回答

    我正在使用CUDA編寫的程序出現問題。我有一個輸入數組和輸出數組,我需要將其複製到設備內存。問題在於兩個陣列太大而無法放入設備內存。我現在正在做的是拆分輸入和輸出數組,併爲這兩個部分按順序運行內核。 爲了使這種方法起作用,我使用了一箇中間數組,因爲cudaMemcpyFromArray和cudaMemcpyToArray只能用於紋理內存。這會導致不必要的內存複製操作。有誰知道更有效的方法?

    4熱度

    1回答

    我正在尋找與GPGPU計算工作時CPU如何將程序代碼移動到GPU相關的信息。互聯網有很多關於數據傳輸的手冊,但不包括關於指令/程序加載的手冊。 問題是:程序由CPU處理,CPU在每個計算單元上用適當的標誌「配置」GPU以執行給定的操作。之後,數據被傳輸和處理。第一次手術如何完成?如何向GPU發佈指令?這些指令是否可以利用總線帶寬進行分組?我可能會忽略一些基本的東西,因此歡迎任何其他信息。

    1熱度

    1回答

    我在Nsight 2.1中調試我的CUDA代碼有一個奇怪的問題。我有兩個全球函數被調用從我main.cu像這樣: dim3 block(threadsPerBlock); dim3 grid(numBlocks); InitPhotons<<<grid,block>>>(devicerun,sources[i],1); cudaThreadSynchronize(); MC<<<grid,

    4熱度

    1回答

    我設計了一個用於iPad遊戲的學習AI,但其原型是用matlab編寫的。我需要執行若干動作,如:(資本表示矩陣) A = B > c; A = B * C; A = B' * C; A = B .* C; A = B - C; 我的一些矩陣是大(2601×100)。在GPU上運行這些操作可以顯着提高此操作的性能。有一個線性代數庫比Accelerate的BLAS更合適嗎? BLAS只支持

    1熱度

    3回答

    據我所知,Nvidia Nsight 2.1提供了調試OpenCL代碼的可能性。 我已通過所有Nsight顯示器要求(禁用WDDM,禁用航空,安裝開發驅動程序,連接到第二個圖形卡),但我仍然無法調試我的代碼。 在VS 2010中使用的「開始調試CUDA」與通知結束: CUDA上下文是在GPU上當前未調試的創建。 斷點將被禁用。 適配器:的GeForce GTX 590 我的C++溶液使用cmake

    0熱度

    1回答

    指標變量我剛開始嘗試C++ AMP和我決定給它與當前項目我工作的一個鏡頭。在某些時候,我要建立我的向量距離矩陣,我已經寫了下面的代碼爲這個 unsigned int samplesize=samplelist.size(); unsigned int vs = samplelist.front().size(); vector<double> samplevec(samplesize*vs)

    7熱度

    1回答

    在C++ AMP中,內核函數或lambda表達式使用restrict(amp)標記,這對允許的C++子集(listed here)施加了嚴格的限制。 CUDA允許在內核函數中的C或C++的子集上有更多的自由嗎?

    1熱度

    2回答

    我試圖開始玩<amp.h>庫。但是當我輸入#include amp.h時,出現錯誤提示無法打開源文件<amp.h>。我需要做些什麼才能使它可用? #include <stdio.h> #include <tchar.h> #include <amp.h>

    1熱度

    1回答

    我試圖將C++ AMP應用程序部署到另一臺Windows 7計算機。 我試圖將vcamp110.dll包含在同一個文件夾中,並且還使用/ MT編譯了msvcp110.dll和msvcr110.dll。 也嘗試了應用程序的x64和win32版本。 在計算機上,我試過它沒有安裝VS11,程序停止響應。 我試圖用hello world應用程序做一個簡單的測試,並且我在那裏也遇到同樣的問題。 這些文件可以