3
是否有單一指令來計算float4
的所有組件的總和?例如,在OpenCL中?OpenCL中的和向量組件(類似於SSE)
float4 v;
float desiredResult = v.x + v.y + v.z + v.w;
是否有單一指令來計算float4
的所有組件的總和?例如,在OpenCL中?OpenCL中的和向量組件(類似於SSE)
float4 v;
float desiredResult = v.x + v.y + v.z + v.w;
float4 v;
float desiredResult = dot(v, (float4)(1.0f, 1.0f, 1.0f, 1.0f));
這是多一點的工作,因爲你是一個每個分量乘加在他們面前,但有些圖形處理器都內置了點積指令因此可能會更快。可能會更慢。這取決於你的硬件。