3
我是CUDA
編程的新手。現在,我有一個問題需要處理:我試圖使用CUDA並行編程來處理一組數據集。對於每個數據集,都需要進行一些矩陣計算。CUDA如何在一個內核函數中啓動一個新的內核調用?
我的設計是這樣的:
啓動N個線程來處理每個數據集,因爲它們是相互獨立的,並且該方法處理它們是相同的。
在1中的每個線程中,我想使用一個新函數,並且此函數也可以像內核一樣工作,因爲它們是矩陣計算。調用M線程並行處理矩陣計算..
有人知道是否有可能嗎?