我正在開發一個應用程序,它可以對圖的每個頂點進行計算。這裏的主要問題是延遲,因爲每個計算都很小。例如,每次計算可能需要10ms才能自行執行,因此PGBL不應該爲進程增加任何顯着的延遲。並行bgl延遲和性能
我可以編寫我自己的準系統圖例程來完成這項任務。當然PBGL有很多更好的功能。例如,如果延遲不是問題,我想甚至可能會將一些計算加載到「雲」中。
因此,基本上,在cpu或多核cpu上跨載體的計算開銷是多少?另外,將來有可能將頂點計算卸載到GPU嗎?
我從來沒有使用PGBL,但在增強庫中遇到它,它吸引了我的眼球,因爲除了潛在的延遲問題之外,它可能接近我的應用程序的完美程度。
例如,將一個非常簡單的樹劃分爲n個分支,每個分支的計算在單獨的核心上運行,還是使用PBGL運行,性能差異會是多少? (對於小的計算時間,顯然計算越大,差異越小)