在一些代碼中,我們需要爲對稱實矩陣(Ax = lamba Bx)的廣義特徵值問題獲得自動向量和自動值。此代碼使用LACPACK中的DSPGVX。我們希望使用MAGMA功能在GPU上加速。我們問的這個論壇,並得到了回答這個在GPU上計算特徵值和特徵向量的性能不佳
http://icl.cs.utk.edu/magma/docs/zhegvx_8cpp.html
我們的矩陣的大小(N)變爲100至50000,甚至更多,這涉及到一個分子的原子數。我們觀察到:
a)對於大於2500(約)的N,MAGMA不起作用;分段故障 b)MAGMA的運行速度總是比LAPACK的慢,大約慢了10倍
這種行爲是否正常,我們能克服嗎?任何人都可以報告任何有關這個類似問題的工作人員得到體面加速的參考嗎?
感謝
你是什麼意思「不起作用」......它沒有運行?它是否會產生錯誤的結果,是否會在運行時崩潰和燒燬? – prelic 2012-03-16 19:06:16
你在使用什麼GPU? – talonmies 2012-03-16 19:53:59
特斯拉c2070與4GB內存 – flow 2012-03-16 19:58:05