我有一種情況,我通過以下方式解決:的OpenCL小於等於和布爾向量
//cube_potentials is float8
//level_vec is float8
//shift_vec is int8 and contains (non-overlapping) bit shifts
int8 shifts = (cube_potentials<=level_vec);
int flag_index = 0;\n"
if (shifts.s0) flag_index |= shift_vec.s0;
if (shifts.s1) flag_index |= shift_vec.s1;
if (shifts.s2) flag_index |= shift_vec.s2;
if (shifts.s3) flag_index |= shift_vec.s3;
if (shifts.s4) flag_index |= shift_vec.s4;
if (shifts.s5) flag_index |= shift_vec.s5;
if (shifts.s6) flag_index |= shift_vec.s6;
if (shifts.s7) flag_index |= shift_vec.s7;
它的工作原理。問題在於所有這些if-statement都令我感到厭煩,我無法想象它們是世界上最快的東西。我想解決這個問題,像這樣:
//Method 1
bool8 less = (bool8)(cube_potentials<=level_vec);
int8 shifts = (int8)(less) * shift_vec;
int flag_index = shifts.s0 | shifts.s1 | shifts.s2 | shifts.s3 | shifts.s4 | shifts.s5 | shifts.s6 | shifts.s7;
//Method 2 (more simply)
int8 shifts = ((int8)(cube_potentials<=level_vec)) * shift_vec;
int flag_index = shifts.s0 | shifts.s1 | shifts.s2 | shifts.s3 | shifts.s4 | shifts.s5 | shifts.s6 | shifts.s7;
的問題是,bool8是保留類型,而不是一個真正的人,所以方法1超出。方法2不能正常工作,但。我懷疑原因與第一條線有關。 < =在兩個浮點向量上,我不知道它返回的是什麼,但是大概當它被轉換爲int8時,它並不全是0和1。
我的問題是,如果有什麼辦法以更清潔,更平行的方式重寫原始代碼?
謝謝,
聰明點twiddling。我想你也可以做「 - (cube_potentials <= level_vec」,然後添加一切,但是按位更好!謝謝, – imallett