如何正確地將參數作爲結構傳遞給NVRTC？

let prog = 
    """//Kernel code: 
extern "C" { 
    #pragma pack(1) 
    typedef struct { 
     int length; 
     float *pointer; 
    } global_array_float; 
    __global__ void kernel_main(global_array_float x){ 
     printf("(on device) x.length=%d\n",x.length); // prints: (on device) x.length=10 
     printf("(on device) x.pointer=%lld\n",x.pointer); // prints: (on device) x.pointer=0 
     printf("sizeof(global_array_float)=%d", sizeof(global_array_float)); // 12 bytes just as expected 
    } 
;}""" 

printfn "%s" prog 
let cuda_kernel = compile_kernel prog "kernel_main" 

let test_launcher(str: CudaStream, kernel: CudaKernel, x: CudaGlobalArray<float32>, o: CudaGlobalArray<float32>) = 
    let block_size = 1 

    kernel.GridDimensions <- dim3(1) 
    kernel.BlockDimensions <- dim3(block_size) 
    printfn "(on host) x.length=%i" x.length // prints: (on host) x.length=10 
    printfn "(on host) x.pointer=%i" x.pointer // prints: (on host) x.pointer=21535919104 
    let args: obj [] = [|x.length;x.pointer|] 
    kernel.RunAsync(str.Stream, args) 

let cols, rows = 10, 1 
let a = d2M.create((rows,cols)) 
     |> fun x -> fillRandomUniformMatrix ctx.Str x 1.0f 0.0f; x 
let a' = d2MtoCudaArray a 

//printfn "%A" (getd2M a) 

let o = d2M.create((rows,cols)) // o does nothing here as this is a minimalist example. 
let o' = d2MtoCudaArray o 

test_launcher(ctx.Str,cuda_kernel,a',o') 
cuda_context.Synchronize() 

//printfn "%A" (getd2M o)

以下是我目前正在處理的main repo的摘錄。我非常接近Cuda C編譯器的F＃語句，但我無法弄清楚如何從主機端正確傳遞參數。如何正確地將參數作爲結構傳遞給NVRTC？

儘管包裝雜注，NVRTC 7.5 Cuda編譯器正在做一些其他的優化，我不知道它是什麼。

因爲我正在關閉F＃語句，所以我需要將參數作爲一個單獨的結構體傳遞給它。如果我將kernel_main(global_array_float x)的功能更改爲kernel_main(int x_length, float *x_pointer)之類的功能，那麼它可以工作，但我不是那種引用系統提供給我的形式，我希望避免做更多的工作來使F＃更像C。

任何想法我可以嘗試嗎？

來源

2016-11-04 Marko Grdinic

我做了兩個錯誤的假設。

第一個錯誤是假設let args: obj [] = [|x.length;x.pointer|]將整齊放置在堆棧旁邊。實際上，這些是兩個不同的論點，第二個在上面傳遞時會在某處丟失。

它可以通過自定義結構類型並重寫如下表達式來修復：let args: obj [] = [|CudaLocalArray(x.length,x.pointer)|]。

另外一個錯誤的假設，我發現當我像上面那樣重寫它時，使用[<StructLayout(LayoutKind.Sequential>]並不意味着這些字段將被打包在一起。相反，像C一樣，pack是一個參數，所以它需要像這樣使用：[<StructLayout(LayoutKind.Sequential,Pack=1)>]。

來源

2016-11-04 16:17:59

如何正確地將參數作爲結構傳遞給NVRTC？

回答

相關問題