我要求對以下問題的一個提醒:GPU蠻力實現
對於一個研究項目,我基於與(PY)的OpenCL GPU的寫蠻力算法。
(我知道JTR就在那裏)
現在我有蠻力發電機在Python被填滿每一輪與字(量= 1024 * 64).I通緩衝GPU內核的緩衝區。 GPU正在計算緩衝區中的每個值a MD5哈希值並將其與給定值進行比較。太棒了!
但是:
我不認爲這是真正的充分表現,我可以從GPU獲得 - 或者是什麼呢?當我不得不通過CPU填充緩衝區並將其傳遞給GPU'僅僅'用於Hash計算比較 - 或者我錯了,這已經是緊固件或幾乎是我可以固定的性能得到?
在我考慮在這裏問這個問題之前,我已經做了大量的研究。到目前爲止,我在GPU內核上找不到強力執行 - 爲什麼?
THX
編輯1:
我試圖解釋它以不同的方式,我想知道是什麼。可以說我有一臺普通的電腦。在GPU上執行蠻力算法比在CPU上執行速度快(如果你做得對)。我已經瀏覽了一些GPU蠻力工具,並且在GPU內核上找不到完整的蠻力實現。
現在我正在向GPU傳遞「文件包」並讓他們完成工作(散列&比較) - 看起來像這是常見的方式。 「拆分」蠻力算法的速度不是很快,因此GPU上的每個單元都會自行生成自己的「單詞包」。
我所做的只是想知道爲什麼常用的方法是將包中的值從CPU傳遞到GPU,而不是在GPU上工作,也不需要CPU。是否因爲不可能在GPU上拆分強力算法,或者不值得將其移植到GPU上?
Thx爲您的時間!我更新了我的問題,也許你可以再看一遍,讓我知道你對此有何看法。我的問題並不清楚我的程序和我的表現 - 它更多的是關於暴力GPU算法的常見實現。 – tobnic
不客氣。我不知道你的算法的具體情況。儘管我提供了一些想法,但值得爲您的問題添加一些特定的標籤。 – srodrb