openacc

    0熱度

    1回答

    這裏是矩陣向量乘法的Fortran子程序。這可能是老式的和低效的多種方式,但現在我只是想獲得它OpenACC的指令來工作,我試圖找出減少是如何工作的: subroutine matrmult(matrix,invec,outvec,n) integer:: n real*8, intent(in):: matrix(n,n), invec(n) real*8, intent(out) ::

    1熱度

    1回答

    我嘗試編譯克雷Fortran編譯的OpenACC的FORTAN代碼... crayftn -o msqcomp -h omp -h acc msquared.f90 失敗,出現錯誤消息 ftn-1350 crayftn: WARNING in command line Command line option "-hacc" is being ignored because an ac

    0熱度

    1回答

    我正在使用OpenACC處理相當大的代碼。現在,我有一個程序foo的調用其他幾個例程酒吧,遠遠的,噓delaing,就像這樣: subroutine foo real x(100,25),y(100,25),z(100,25) real barout(25), farout(25), booout(25) do i=1,25 call bar(barout, x(1,i),y(

    3熱度

    1回答

    我試圖並行化的程序,做一些圖像處理與OpenACC的。作爲該處理的一部分我有定義類似於自定義結構: typedef struct { RGB *image; double property; } Deep; 哪我的陣列Deep *structPointer內訪問。 我所遇到的一些文件進行手動複製的structPointer的全部內容到GPU,這給我留下了下面的代碼。 De

    0熱度

    1回答

    許多OpenACC教程假定編譯器/加速器將通過自動檢查依賴性並確保循環實際可並行化來檢查正確性。但是,OpenACC規範似乎沒有提及任何有關強制性正確性分析的內容。 OpenACC編譯器是否有OBLIGATED來檢查循環是否實際可並行化,如果循環不是,可以放棄?

    1熱度

    1回答

    我正在PGC++上開發代碼以圖形化加速代碼。 我使用的OpenBabel具有特徵依賴性。 我已經使用#pragma ACC內核 我已經嘗試使用嘗試的#pragma ACC常規 我的編譯命令是:「PGC++ -acc -TA =特斯拉-Minfo =所有-I /家庭/ pranav/new_installed /include/openbabel-2.0/ -I/home/pranav/new_in

    0熱度

    1回答

    我想用cublasDgemm()替換對「cblas_dgemm()」的調用。下面是從鯊魚機器學習庫中的原始包裝: inline void gemm( CBLAS_ORDER const Order, CBLAS_TRANSPOSE TransA, CBLAS_TRANSPOSE TransB, int M, int N, int K, double alpha, dou

    2熱度

    1回答

    我一直在關注這個教程對我杰特森TK1本地安裝OpenACC的,我發現安裝腳本是不正確的。我沒有看到任何錯誤,當我編譯OpenACC的圖書館,但是當我試圖編譯我得到那個說 [email protected]:~/apps/acc/accull/yacf/examples/acc$ accull -v -o gpu.x acc_test.c *****************************

    1熱度

    1回答

    我試圖加速使用OpenACC編寫的opencv程序,我使用accull編譯器來執行此操作。但是,我很難找到任何有助於解決此問題的文檔或示例。 http://scelementary.com/2015/04/30/openacc-on-jetson-tk1.html

    0熱度

    1回答

    我想在Makefile中使用PGI編譯器的-U__GNUG__標誌,試圖編譯一個文件夾內的所有.cpp文件,鏈接到Armadillo(使用g ++編譯器中,代碼編譯和運行),我有Makefile文件如下: CC=pgc++ CFLAGS= -U__GNUG__ -std=c++11 -fast -acc -Minfo=accel -larmadillo -lgsl -w all: