gpu-programming

    4熱度

    3回答

    由於我希望我的GPU爲我做一些計算,因此我對測量「紋理」上傳和下載速度的主題感興趣 - 因爲我的「紋理」是GPU應該緊縮。我知道從主內存傳輸到GPU內存是優先選擇的方式,所以我期望這樣的應用程序只有在有大量數據需要處理並且回讀的結果很少時纔有效率。 無論如何,任何這樣的基準應用程序?我的意思是,用於測量主內存<> GPU傳輸吞吐量... EDIT(問題澄清): 一旦有一個應用程序,您啓動,並且給出

    17熱度

    4回答

    我目前正在GPU上編寫一個矩陣乘法,並希望調試我的代碼,但由於我無法在設備函數中使用printf,是否還有其他方法可以用來查看要執行的操作在那個函數裏面。這我目前的功能: __global__ void MatrixMulKernel(Matrix Ad, Matrix Bd, Matrix Xd){ int tx = threadIdx.x; int ty = thread

    3熱度

    6回答

    我前幾天開始研究GPGPU,併成功實現了具有良好性能的cholesky因式分解,並且我參加了高性能計算會議,有人說「GPGPU是一個黑客」。 我仍然困惑這是什麼意思,他們爲什麼說它破解。有人說這是黑客攻擊,因爲你正在將你的問題轉化爲矩陣並對其進行操作。但是我仍然很困惑,人們是否認爲這是一種黑客行爲,或者如果是的話,爲什麼? 任何人都可以幫助我,爲什麼他們稱它爲黑客,而我發現它沒有任何問題。

    1熱度

    2回答

    我在Windows XP SP3上使用了ATI Stream SDK,並在GPU上實現了一種算法。但現在我有興趣在多臺機器上的多GPU上擴展這種算法,我切換到UBUNTU以使用MPI(發送消息)。 我GOOGLE了這個,但我得到了安裝在SLES和RHEL的參考,但我正在尋找UBUNTU 9.04。 感謝 GG

    6熱度

    4回答

    我想參與一個爲期2-3個月的項目(全職),涉及C++編碼並涉及到網絡(協議棧)。我正在考慮編寫我自己的網絡堆棧,但這看起來並不有趣。找到一個想法來實現分佈式系統/ GPU的類似tcp/ip的堆棧,在網絡性能更好的情況下會更好。我一直在使用谷歌搜索3小時,但沒有遇到任何值得花費2個月的東西。像netperf這樣的開源項目似乎超出了我的範圍。我真的很喜歡一個相對較小的獨立項目,我可以按照自己的步調開展

    0熱度

    1回答

    我想弄清楚閃存10的GPU加速功能的程度。是否有可能100%的代碼GPU加速,或者只有某些沙盒功能?即使我不得不離開瀏覽器來獲取它,或者確切知道在瀏覽器內部可以實現多少和什麼樣的GPU加速。 鏈接到一個很好的文章將是驚人的。

    5熱度

    1回答

    我是GPU編程的新手,我使用brook +語言在ATI Stream Processor上進行強力RAR密碼恢復,但是我發現用brook +語言編寫的內核沒有允許任何調用正常的函數(內核函數除外),我的問題是: 1)如何在這種情況下使用unrar.dll(unrar存檔文件)API?這是編程RAR密碼恢復的唯一方法嗎? 2)使用GPU的crack和ElcomSoft軟件怎麼樣,它們是如何工作的?

    4熱度

    2回答

    我在GPU上分配一個cl_mem緩衝區並對其進行處理,直到超過特定的大小才能正常工作。在這種情況下,分配本身成功,但執行或複製不成功。我想使用設備的內存更快的操作,所以我分配像: buf = clCreateBuffer (cxGPUContext, CL_MEM_WRITE_ONLY, buf_size, NULL, &ciErrNum); 現在我不明白的是大小的限制。我正在複製大約16 M

    7熱度

    4回答

    這個問題說明了一切。我希望我不必在C++ .dll中編寫代碼,然後從託管代碼中調用它。

    10熱度

    9回答

    當我在控制檯登錄時,我的OpenCL程序可以找到GPU設備,但是當我使用ssh遠程登錄時,無法找到GPU設備。此外,如果我在ssh會話中以root身份運行程序,程序可以找到GPU。 該電腦是一款帶有GeForce 9400 GPU的Snow Leopard Mac。 如果我從控制檯或以root身份運行的程序(見下文),輸出如下(注意「的GeForce 9400」線): 2 devices foun