這是我認爲可能是一個奇怪的問題。使用OpenCL進行FFT和流式傳輸操作
有沒有人知道OpenCL中一維FFT的快速實現,它不是並行的。
這就是爲什麼我想要一個這樣實現的版本。
我有一個當前任務實施處理,其中:
- 注意到在64個值。對FFT
- 的輸出
- 胚的FFT對這個數據
- 胚更多的分析生成約6的值並返回。
這是重複約1-4萬次上輸入不同的值。每組輸入都是相互獨立的。
由於輸入爲單次操作我被跳躍到或者分裂輸入成組或某種流的過大。
有誰知道類似的例子代碼。
我在學習OpenCL的早期階段,但是這個任務稍微提前一點。任何幫助,將不勝感激。
您可以在NVIDIA,AMD和Intel SDK中找到FFT的一些示例。並看看_OpenCL in Action_和_OpenCL Programming Guide_書籍。 –
我已經看過大部分這些,它們都是FFT的並行版本。我想要的是一個非並行版本,因此每個輸入集在其執行過程中都不會被並行化。如果不需要在單個操作中調度線程,那麼由於不同輸入集的數量,我應該得到更好的利用率。 –
爲什麼你不能只是採取C實現,然後將其移植到OpenCL? – KLee1