gpu中的平行凸包算法

我正在CUDA中實施凸包的分而治之的方法。這是我的方法：自上而下：gpu中的平行凸包算法

但它變得太複雜了，我覺得我沒有利用CUDA的並行功能，因爲在樹的每一層都創建了N/2^i線程，在合併所有相鄰的船體時，複雜度爲O（N）。因此，網絡複雜性仍然是O（N logN）。

你能告訴我如何讓它變得更好嗎？或者爲凸包提供任何替代的整理器並行算法（如果我可以得到graham掃描的並行版本的算法，那將會很棒）？

2011-07-30 alpha_cod

將你的算法的複雜度仍然是O（N）（相比沒有改變一個線程版本），因爲你做3兩件事：

但是，如果你的點沒有排序，你應該更好地並行排序。

2011-07-30 15:17:04

回答