PyCUDA：設備代碼中的Pow嘗試使用std :: pow，失敗

2011-04-13 60 views 4 likes

問題或多或少地說明了一切。PyCUDA：設備代碼中的Pow嘗試使用std :: pow，失敗

calling a host function("std::pow<int, int> ") from a __device__/__global__ function("_calc_psd") is not allowed

從我的理解，這應該是使用cuda pow函數，而不是。

來源

2011-04-13 Bolster

回答

該錯誤與編譯器報告完全相同。您不能在設備代碼中使用主機函數，並且包含整個主機C++ std庫。 CUDA包含自己的標準庫，在編程指南中有描述，但是您應該使用pow或fpow（從C標準庫中取得，不包含C++或名稱空間）。 nvcc將使用cuda正確的設備函數重載該函數並內聯結果代碼。像下面的東西將工作：

#include <math.h> 

__device__ float func(float x) { 

    return x * x * fpow(x, 0.123456f); 
}

編輯：我錯過了第一次是位錯誤報告的模板說明符。你確定你傳遞了float或double參數給pow嗎？如果傳遞整數，CUDA標準庫中沒有重載函數，這就是它可能失敗的原因。如果你需要一個整數冪函數，你將不得不推出你自己的（或做鑄造，但pow是一個相當昂貴的函數，我相信一些級聯整數乘法會更快）。

來源

2011-04-14 05:46:48 talonmies

相關問題

1. 使用參數atan2/pow編譯std :: transforms會失敗（但可以使用gcc）
2. POW使用
3. 什麼比std :: pow更快？
4. PyOmo/Ipopt以「無法評估pow」失敗
5. 大量使用pow（）
6. 在C中使用pow（）
7. std :: pow不返回預期的int值
8. std :: pow（）輸出是...特殊的？
9. std :: pow在static_assert觸發錯誤C2057？
10. 與POW一起使用NGrok