openacc

    1熱度

    1回答

    我想開始開發OpenACC程序,我有幾個問題要問: 是否可以在AMD gpu上執行OpenACC代碼? 如果是這樣,我正在尋找一個可用於Windows環境的編譯器。我花了一小時找不到任何東西,我急於找到任何可以讓我編譯Openacc指令的東西。

    0熱度

    1回答

    我想弄清楚,如果我可以使用OpenACC來代替正常的CPU串行執行調用。通常我的編程都是關於3D編程,或者通常以某種方式使用GPU。 I.E.圖像處理或需要使用着色器的其他類型的渲染。我試圖弄清楚這個圖書館是否會讓我受益。 我問這個問題的原因是因爲如果我渲染3D圖形(儘可能快)會減慢這個過程嗎?或者它能夠維持它(理論上)「高幀速率」還是不能。 如果是這樣,什麼是折衷和多少?我不願意鬆動3D圖形(顯

    0熱度

    1回答

    我正在使用pgi編譯器使用openacc。我想知道如何在運行時配置關於內存使用情況的代碼,特別是共享內存? 非常感謝您的幫助! Behzad

    0熱度

    1回答

    我正在使用PGI 15.7編譯器。我想知道如何通過OpenACC將定義的結構從CPU複製到GPU。 typedef struct str_ { int n; int m; int* col; // size [n*m] double* val; // size [n*m] }str; 非常感謝。

    0熱度

    1回答

    我想生成的代碼,CUDA被保存在檢查的文件。 OpenAcc和PGI編譯器可以做到這一點嗎?

    0熱度

    1回答

    我在OpenACC中做了一個非常簡單的向量添加內核。我想知道這是否與我使用的編譯器有關(與OpenCL一起使用)有問題,因爲我遇到問題,似乎將數據從設備複製回主機。所有的結果都是正確的但是結果[0]。例如。下面的代碼: for (i=0; i<VEC_SIZE; i++) { a[i] = i; b[i] = VEC_SIZE-i; result[i]=0;

    0熱度

    2回答

    我正在研究OpenACC計算流體動力學代碼,通過將整體計算分解爲一堆小操作來增加循環內部計算的粒度。我最終的目標是通過將最初的複雜任務分解爲GPU上的一些較簡單的任務來減少每個威脅的註冊量。 舉例來說,我有很多的公式來計算計算域的特定節點: !$acc parallel loop ... do i=1,n D1 = s(i+1,1) - s(i-1,1) D2 = s(i+1

    1熱度

    1回答

    在此代碼: #include <iostream> void intfun(int * variable, int value){ #pragma acc parallel present(variable[:1]) num_gangs(1) num_workers(1) { *variable = value; } } int main(){

    0熱度

    2回答

    我想用openacc和PGI 15.7編譯器加速我的代碼。 我想在C源代碼級別上剖析我的代碼。 我使用的是CUDA 7.0中的'nvvp'分析器。當我運行nvvp時,我可以使用'分析點擊'並獲得哪個延遲是我的代碼變慢的原因。 (數據依賴性,條件分支和帶寬等) 但是,我無法獲得基於行的分析,只能進行'內核'級分析。 (例如main_300_gpu內核使用10s)。 所以我有一些麻煩知道我必須在哪裏修

    1熱度

    1回答

    爲什麼以下代碼: #include <iostream> int main(int argc, char const *argv[]) { int sum = 0; int *array; array = new int [100]; #pragma acc enter data create(array[0:100],sum) #pra