1
嵌套在Halide :: sum上的印刷循環與在tutorial中編寫的最佳版本不同等。Halide sum loops嵌套
該代碼爲零初始化和求和提供單獨的循環。
Halide::Func f("f");
Halide::Var x("x");
Halide::RDom r(0, 3);
f(x) = Halide::sum(r + x);
f.print_loop_nest();
f.realize(10);
輸出:
produce f:
for x:
produce sum:
for x:
sum(...) = ...
for x:
for r4:
sum(...) = ...
consume sum:
f(...) = ...
可以融合這個循環,或不影響性能?謝謝!
更新:保險絲這樣的:
produce f:
for x:
produce sum:
for x:
sum(...) = ...
for r4:
sum(...) = ...
consume sum:
f(...) = ...
Andrew,謝謝!現在我懂了。 –