2016-12-07 21 views
8

我知道這個問題之前已經被問過好幾次了,但是除了幾個作者寫的幾個包之外,我沒有在google上發現很多東西。無論如何,是否有計劃將張力流中的roi pooling層(官方)包含在內,因爲它是對象檢測和其他任務的重要組成部分,而且無法訪問它是使用tensorflow時的一個難題。有沒有計劃用於物體檢測的張量流ROI池層?

歡迎任何評論或替代實施(如果驗證)。

+2

它是快速(er)r-cnn的重要組件,不用於對象檢測。還有其他的方法不使用它 - 看看https://arxiv.org/abs/1611.10012 – etarion

+0

感謝提及這篇論文,我會通過它。是的,我知道最近YOLO和SSD檢測器已經被提出,能夠在不需要明確區域的情況下進行檢測。但是投資回報池也可以看作是一個標準模塊,用於根據在實際圖像空間中的位置來合併conv層中的要素。這超出了對象檢測的用途,例如最近的視覺參考工作。 – ksikka

+0

再次感謝發送這篇文章@etarion,因爲我看到在特徵映射上使用調整大小裁剪過程實現了roi池化。我可以看到這是解決這個問題的另一種方法。 – ksikka

回答

8

我能用上面的文件找到我的問題的答案。您可以使用tf.image.crop_and_resize函數來裁剪網絡的任何部分並調整其大小。類似於ROI池,可以裁剪一個邊界框(按照下采樣步驟的數量縮小,例如VGG16中的32個),並將其大小調整爲N×N(例如VGG16中的7×7),然後可以將其饋送到完全連接層。