這個問題是概念性的。我基本瞭解MNIST示例如何工作,前饋網絡將圖像作爲輸入並輸出預測標籤0至9.使用卷積神經網絡的逐像素分類?
我正在開發一個項目,該項目理想情況下會將圖像作爲輸入,並且對於每個像素在該圖像上,我將輸出該像素是否爲特定標籤的概率。所以我的輸入,例如600 * 800 * 3像素的大小,我的輸出將是600 * 800,其中我輸出的每一個條目都是一個概率。
如何設計使用卷積神經網絡的流水線?我正在與Tensorflow合作。感謝
精化:
基本上我想每個像素標記爲前景或背景(像素是前景的概率)。我的直覺是,在卷積圖層中,神經元將能夠拾取圍繞該像素的補丁中的信息,並最終能夠確定這個像素有多可能成爲前景。
單個像素如何被分類爲特定標籤?你能再詳細一點嗎?也許是一組像素,但一個像素被歸類爲一個難以可視化的標籤 –
這基本上是語義分割,請參閱論文「用於語義分割的完全卷積網絡」以獲取更多信息。 –
@LuisLeal我想將每個像素都標記爲前景或背景(像素爲前景的概率)。我的直覺是,在卷積圖層中,神經元將能夠拾取圍繞該像素的補丁中的信息,並最終能夠確定這個像素有多可能成爲前景。 – Paler