深度vs位置

我一直在閱讀關於從深度緩衝區重構世界空間中片段的位置，但我正在考慮將位置存儲在高精度三通道位置緩衝區中。這樣做會比從深度緩衝區解壓縮位置更快嗎？從深度重建位置的成本是多少？深度vs位置

2013-08-31 Abaab

也許我錯過了一個細節或者它可能被省略了，但是我在3維空間中的位置與1維空間的深度並不相同。您無法從1維數據重建3D座標。它就像問我住在哪裏，我回應了20英里的機場。 20英里的方式......在2D空間中，深度等於圓的半徑。 – mwjohnson

@mwjohnson給定逆向投影矩陣和深度紋理上樣本位置的座標，您可以從深度重建位置。對不起，我沒有說清楚。它有時以延遲着色方式完成。 – Abaab

在桌面GPU上，根據深度重建位置是最佳選擇。所有的商業圖形引擎都這樣做，它節省了大量內存帶寬。 –

這個問題的原因有兩個基本無法回答：

最後一點很重要。您基本上將GL_RGBA16F的紋理獲取性能（至少）與GL_DEPTH24_STENCIL8獲取的性能進行比較，然後進行一些ALU計算。基本上，您要問的是，每個片段獲取32位的成本（24x8獲取與RGBA16F獲取之間的差異）是否等同於ALU計算。

這會隨着各種事情而改變。提取內存，紋理緩存大小等等的性能都會對紋理獲取性能產生影響。並且ALU的速度取決於一次將有多少人在飛行（即：着色單元的數量）以及時鐘速度等等。

總之，這裏有太多的變數，知道先驗答案。

這就是說，考慮歷史。

在着色器最早的日子裏，回到GeForce 3天，人們需要重新規範從頂點着色器傳遞過來的法線。他們通過使用立方圖來做到這一點，而不是通過對法線進行數學計算。爲什麼？因爲速度更快。

今天，幾乎沒有沒有通用可編程GPU硬件，在桌面或移動空間中，立方體貼圖紋理獲取比點乘積，倒數平方根和矢量乘法更快。長期計算性能超過內存訪問性能。

所以我會建議與歷史一起去尋找quick means of computing it in your shader。

2013-08-31 02:56:05

是的，我記得當我離開這個行業一段時間後被人嘲笑，並詢問正常化立方體地圖發生了什麼:)我們走過了一段很長的路。回顧一下，有趣的是，從查找紋理中獲取的代價遠遠小於一個非常重要的操作（包括'DP3'，'RSQ'和'MUL'的一系列指令）。 –

回答