0
我想知道是否有一個CUDA相當於alloca函數。Cuda equivlent的alloca
我需要創建浮點數組作爲我試圖優化的數學函數的參數。問題是,我並不想知道編譯時參數的數量,這正是我現在使用模板所做的。我可以在CUDA中使用新的運算符,但我覺得它很慢(也許我可以預先分配它或什麼)。我會使用共享內存,但它不夠大。
我想知道是否有一個CUDA相當於alloca函數。Cuda equivlent的alloca
我需要創建浮點數組作爲我試圖優化的數學函數的參數。問題是,我並不想知道編譯時參數的數量,這正是我現在使用模板所做的。我可以在CUDA中使用新的運算符,但我覺得它很慢(也許我可以預先分配它或什麼)。我會使用共享內存,但它不夠大。
沒有任何我知道哪些與CUDA的alloca
一樣工作。無論如何,CUDA ABI中的堆棧幀在編譯時由彙編器靜態分配,因此我懷疑是否有任何動態分配堆棧幀中的內存的範圍