openacc

    0熱度

    1回答

    我想在GPU上並行化一個python循環,但我不想使用pyCUDA,因爲我需要自己做很多事情。我正在尋找OpenACC之類的東西,就像C++中的python一樣來實現簡單的並行化,但似乎沒有這樣的事情。所以我想在C++中使用OpenACC,然後系統調用一個pthon腳本,如下面的代碼所示。這會工作嗎?還是有沒有簡單的選擇,而不使用pyCUDA? void foo(float*parameters)

    0熱度

    1回答

    我是nvprof的新用戶,當我嘗試使用nvprof來剖析我的代碼時出現錯誤。我在代碼中添加了一些OpenACC指令。我使用的cuda工具包是Cuda8.0。我的代碼是用fortran90 + OpenMPI編寫的。我使用16個核心進行並行計算。下面是我用來提交代碼的腳本: #!/bin/bash -l # #SBATCH --nodes=1 #SBATCH --ntasks=16 #SBA

    0熱度

    1回答

    我嘗試新的PGI社區版本(17.4)與玩具的例子(見下文)並調用acc_init的時候,我發現了CUDA驅動程序API內部錯誤後返回CUDA_ERROR_INVALID_DEVICE。 重現該錯誤的代碼是: #include <openacc.h> #include <cuda_runtime_api.h> #include <stdio.h> int main() { acc

    0熱度

    1回答

    我試圖編譯一個子程序FORTRAN爲$ ACC常規SEQ 我收到以下錯誤消息 /scratch/tmp/pgaccKU0jSWcDesiI.gpu(93)!錯誤:標識符 「pgf90_mzero8」 是 「/scratch/tmp/pgnvdgV0jsxZLyFWv.nv0」 的編譯 PGI編譯器版本17.4 文本情況下檢測未定義 1錯誤 子程序XX(ndime,pgaus,YY) $!ACC常規

    0熱度

    1回答

    我有興趣直接從GCC編譯的代碼使用PGI OpenACC運行時API。 我注意到PGI OpenACC安裝提供了兩個openacc.h頭文件。一個用於PGI(位於include/openacc.h),另一個似乎與GCC兼容(etc/include_acc/openacc.h)。使用GCC的第二個標頭是安全的? 到目前爲止,我已經能夠編譯&運行一個小測試: #include <openacc.h>

    0熱度

    1回答

    電話PGI運行時不支持的功能 - !pgf90_copy_f77_argl_i8 我相信我傳遞一個8字節的整數參數澳元ACC程序。 任何解決方法或在此更新? PGI編譯器17.4 示例。 type some integer(4),pointer :: xx(:) integer(4),pointer :: yy(:) end type type(some), pointer :: dat

    0熱度

    1回答

    我想運行一個簡單的測試用例,其中動態分配的數組A被定義爲extern並使用OpenACC上傳到GPU。全部使用PGI編譯器。 我header.h文件: extern int *A; #pragma acc declare create(A) 然後,我header.c實現: int *A; #pragma acc declare copyin(A) 然後,在main.c

    1熱度

    2回答

    我已經構建了一些使用OpenACC的C++代碼,並將其編譯爲PGI編譯器以用於Tesla GPU。 編譯成功,沒有任何警告。 我運行該程序,並得到了兩個錯誤: call to cuStreamSynchronize returned error 717: Invalid address space call to cuMemFreeHost returned error 717: Invalid

    1熱度

    1回答

    我有一些使用PGI編譯器編譯的OpenACC加速C++代碼。事情似乎有效,所以現在我想用分析信息來發揮效率。 我通過設置產生一些定時信息: export PGI_ACC_TIME=1 ,然後運行該程序。 的輸出結果如下: -bash-4.2$ ./a.out libcupti.so not found Accelerator Kernel Timing data PGI_ACC

    0熱度

    1回答

    我讀過Fortran派生類型的手動深度複製是可能的,但下面的簡單測試程序在運行時失敗;程序與PGI v16.10完全編譯。什麼出錯? program Test implicit none type dt integer :: n real, dimension(:), allocatable :: xm end type dt