pyopencl

    4熱度

    2回答

    我有一個問題:快速線性系統求解(我有很多這樣的系統)。我將使用GPU和OpenCL來解決它。 我喜歡動態語言如Ruby或Python,我得到了使用低級語言,比如C.的習慣了 所以,我有兩個同時發生的目標: 制定這樣的OpenCL解決方案以儘可能少的努力盡可能快地解決線性系統。 不要在性能上鬆動很多。爲了方便起見,我不希望支付2-10倍的減速,但我已經準備好用高級語言支付30-50%的費用。 對我來

    0熱度

    2回答

    更新:在我的內核int4是錯誤的。 我正在使用pyopencl,但無法使結構對齊正常工作。在下面調用內核兩次的代碼中,b值正確返回(如1),但c值有一些「隨機」值。 換句話說:我想讀一個結構的兩個成員。我可以閱讀第一個,但不是第二個。爲什麼? 無論我使用numpy結構化數組還是使用struct打包,都會發生同樣的問題。並且評論中的_-attribute__設置也沒有幫助。 我懷疑我在代碼的其他地方

    14熱度

    2回答

    我曾在幾個項目上與OpenCL合作過,但一直將內核編寫爲一個(有時很大)的函數。現在我正在研究一個更復雜的項目,並希望在多個內核之間共享函數。 但我能找到的所有例子都顯示內核爲單個文件(很少有甚至調用輔助函數)。似乎應該可以使用多個文件 - clCreateProgramWithSource()接受多個字符串(並且將它們結合起來,我假設) - 雖然pyopencl的Program()只接受單一來源