我想編寫一個CUDA函數來提取滿足特定條件的圖像點,然後將它們放置在設備的連續內存塊中。CUDA:如何將特定圖像點提取爲連續矢量?
點在設備上的連續內存塊中的原因是,我可以立即使用塊和線程ID作爲此列表中點的索引並行處理這些點。
如果我使用相同的內核(函數)來檢測它們,我浪費了大部分線程,因爲我想爲每個圖像點分配一個線程,並且很少線程將屬於所需的點。其餘的線程將不得不坐下來等待。更不用說,正在處理所需點的線程將屬於不同的塊,嚴重破壞了首先並行操作的預期收益。
如果您對如何獲取一組積分以及將它們並行傳輸到設備上的新位置(!)有任何建議,我願意接受。謝謝你的時間。
謝謝,我會試試看! – 2011-04-27 06:19:54