2017-08-29 158 views
1

我試圖在Ubuntu ppc64le上用CUDA-9構建TF 1.3。有了CUDA-9支持所需的所有補丁(eigen,nccl,甚至[TF's PR](https://github.com/tensorflow/tensorflow/pull/12502)),我可以構建大部分TF代碼,但是,它在編譯tensorflow/core/kernels/fft_ops.cc。 我用CUDA-8檢查過TF1.3,它在ppc64le上沒有任何問題。有沒有人遇到過這種問題?我試過bazel 0.4.5和0.5.3以及兩個版本,問題仍然存在,即使將TF的PR用於CUDA-9支持也不會對構建問題產生影響TF 1.3版本與CUDA-9掛在ppc64le

+0

我發現調用fft_ops.cc文件中CPU的所有FFT內核註冊導致掛起,但不知道如何以及爲什麼。註釋掉這些代碼也可以讓TF成功編譯。任何指針都會很有幫助。謝謝。 –

+0

我發現這個掛起的原因。這是由於Eigen的局部變化已經爲我們的舊TF(<1.3)+ CUDA-8工作,但與新TF(> 1.3)和CUDA-9及其各自的Eigen無關。因此關閉這個。 –

回答

0

我找到了導致此掛起的原因,這是由於Eigen的本地更改一直在爲我們工作舊的TF(< 1.3)+ CUDA-8,但沒有新的TF(> 1.3)和CUDA-9以及它們各自的Eigens。在Ubuntu上,問題以掛起的形式被提出,沒有線索,而RHEL很友善地拋出該確切的錯誤。 謝謝, Nishidha