2015-11-10 181 views

回答

3

不,目前的實現是針對2D圖像(像nn.conv2d這樣的函數)。它們支持多個通道(例如RGB),並且可以將3D圖像表示爲多通道2D圖像(每個z-切片都是通道),但這並不總是理想的。此外,對於使用這些方法,您需要大量的圖像數據,這在醫療領域通常很難實現。

更新:TensorFlow和Theano(隨後Keras,Lasagne等)現在都支持上述的3D操作。需要注意的是,3D操作比類似的2D操作更具計算能力和內存密集性。

+0

它是如何從conv2D有什麼不同?在我看來,Conv3D是批量+圖像,它創建了批+特徵圖。在conv2d中,我們有帶有頻道的圖像,這會創建kxWxH特徵地圖。 你有多少張圖片?那麼將會創建x個要素圖。 AM我錯了? – Breeze

+0

那麼conv2d是一個4維矩陣(圖像計數,通道數,x寬度,y寬度),conv3d操作是5維矩陣。 – kmader

+1

是的,這是對的,我只是想如果手術是一樣的,說實話我失去了如何進行手術。當我們談論時間跨度時,這是什麼意思?我們如何爲時間維度邁進?我知道5幀,連續稱爲時間維度。 (圖像數量,深度,通道數量,x寬度,y寬度),這裏的深度爲5.表示有5個幀,例如200x200x3。 那麼在這方面步幅是如何理解的? – Breeze

0

如果你想使用CNN與3D圖像,可能的替代方案是使用Caffe PR。 您需要將數據轉換爲HDF5格式。

10

TensorFlow現在支持主分支中的3D convolution3D pooling

您可以將它們與5D張量一起用作形狀輸入:[batch_size, depth, height, width, channels]

+0

3D轉置(解卷積)如何? –

+1

幸運的是,有一個[拉請求](https://github.com/tensorflow/tensorflow/pull/3049)的方式將增加支持。另見[this issue](https://github.com/tensorflow/tensorflow/issues/2467) –

+0

哇,這是幸運的 –

相關問題