我試圖在Python中執行擬合值迭代(FVI)(包括使用分段線性插值來近似5維函數)。在CUDA中相當於scipy.interpolate.griddata
scipy.interpolate.griddata完美適用於此。但是,我需要調用插值程序幾千次(因爲FVI是基於MC的算法)。所以基本上,已知函數的點集是靜態的(大的 - 比方說32k),但是我需要近似的點(它們是原始集合的小擾動)非常大(32k x 5000說)。
scipy.interpolate.griddata是否存在一個已經移植到CUDA的實現?或者,有沒有辦法加快計算速度?
謝謝。
你好,是的 - 我沒有最終結束了做大部分工作的自己。我在scipy.spatial.Delauny中查看了find_simplex的實現,發現基本思想可以很容易地並行化得足夠多。所以基本上我運行了2個循環 - 一個爲每個MC樣本查找(和存儲)單純形,另一個查找存儲的單形並計算其插值的重心座標。它受視頻內存限制,但速度非常快。 – user1726633