-2
該代碼的執行時間代碼段評價1D CUFFT
cudaEventRecord(start, 0);
/* creates 1D FFT plan */
cufftPlan1d(&plan, NX, CUFFT_C2C, BATCH);
/* executes FFT processes */
cufftExecC2C(plan, devPtr, devPtr, CUFFT_FORWARD);
cudaEventRecord(stop, 0);
cudaEventSynchronize(stop);
措施二者由CUFFT創建一個計劃和執行時間所需的時間。
如何僅測量執行時間而不包括制定計劃所需的時間?
'cufftPlan1d()'後面放''cudaEventRecord(start,0)''另外,我認爲你需要''cufftExecC2C()''後''cudaDeviceSynchronize()' –
@SagarMasuti也許你應該發表你的評論作爲答案。無論如何,我反對這個問題,因爲它沒有顯示任何努力來理解這個問題。 – JackOLantern